Mr-Cirrus: Implementación de Map-Reduce bajo MPI para la ejecución paralela de programas secuenciales

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Mr-Cirrus: Implementación de Map-Reduce bajo MPI para la ejecución paralela de programas secuenciales"

Transcripción

1 Mr-Cirrus: Implementación de Map-Reduce bajo MPI para la ejecución paralela de programas secuenciales Daniel Ramet 1, Juan Lago 2, Johan Karlsson 1, Juan Falgueras 3 y Oswaldo Trelles 1 Resumen Este documento presenta la aplicación Mr-Cirrus (Map-Reduce High Level Clouds) que permite la ejecución de programas secuenciales, sin ninguna modificación interna, trabajando en colaboración para producir un resultado coordinado en entornos de red, computación en nube (cloud computing) y multiprocesadores. El marco de desarrollo se basa en el paradigma Map- Reduce y ha sido implementada bajo MPI. De esta forma, muchas aplicaciones bioinformáticas (sobre las 200 actualmente incluyendo Dotplots, comparación de secuencias, PAML, Muscle, MAFFT, MrBayes y BLAST) pueden escalarse a través de su ejecución paralela, sin necesidad de instalaciones específicas o de alto coste, ni necesidad de conocimientos de programación en entornos multiprocesador. Se han realizado pruebas intensivas en diferentes tipos de procesos con diferentes cargas computaciones y patrones computacionales, con resultados satisfactorios. Palabras clave MapReduce, Cloud Computing, MPI, bioinformática, escalabilidad. encargadas de procesar los datos moleculares son estrictamente regulares, pero cuyo problema actual es el manejo de los nuevos volúmenes de datos y que por lo tanto se adaptan perfectamente a una ejecución paralela. Así, por ejemplo, la ejecución de una búsqueda por semejanza entre una secuencia problema y una colección de secuencias escala linealmente con el número de secuencias en la base de datos, sin ninguna dependencia de datos con respecto al orden de comparación ni a la completitud de los datos a comparar en el caso de repartir el proceso en varios subprocesos que produzcan resultados parciales. La tercera razón viene motivada por el éxito del paradigma Map-Reduce [10] en entornos de computación de alto rendimiento. Su facilidad de uso matiza de forma efectiva la falta de programadores especializados en construir software de alto rendimiento. Se estima que menos del 1% de los desarrolladores de software a nivel mundial están entrenados en computación paralela, y dar el salto a ella no es en absoluto trivial. L I. INTRODUCCIÓN A computación en la nube o cloud computing [1] ha reinventado el tradicional Centro de Datos (data center) para la prestación de servicios computacionales, con una rápida introducción y aceptación en distintos sectores y ámbitos de actividad [2]. Esto es así en gran medida porque la computación en la Cloud promete, y en muchas situaciones lo consigue, recortes en los costes operativos y de capital en la gestión de los recursos computacionales de las instituciones por el ahorro en la adquisición de la infraestructura a cambio de alquilar un recurso de pago-a-demanda según consumo de los recursos (computación, almacenamiento, ancho de banda, etc) y evitando la gestión de las tareas de mantenimiento y puesta a punto del centro de datos. Hay proveedores de servicios en Cloud (como por ejemplo Google App Engine [3], Microsoft Azure [4], IBM Smart Cloud [5] y Amazon EC2 [6]) que ofrecen cantidades importantes de CPU y almacenamiento bajo un software de gestión robusto y sobre cuyas plataformas es relativamente simple instalar una infraestructura en cuestión de minutos [7]. Por otra parte, el espectacular incremento en la producción de datos moleculares (del orden de los Tera y Petabytes) [8,9] y la necesidad de analizar múltiples hipótesis bajo diversos escenarios hace que el análisis de datos genómicos en la biología actual requiera de una potencia computacional que debe ser buscada en la computación paralela. También debemos tener presente que una buena parte de las aplicaciones bioinformáticas 1. Dpto. de Arquitectura de Computadores, Universidad de Málaga. dramet, tjkarlsson, 2. Dpto. de Innovación y Tecnología, Fundación IAVANTE. 3. Dpto. de Lenguajes y Ciencias de la Computación, Universidad de Málaga. En este contexto, el objetivo principal de este trabajo es proporcionar un marco de ejecución de aplicaciones secuenciales, con la premisa de no modificarlas en absoluto, en varias instancias paralelas. El esquema se basa en un gestor de la ejecución que hace a la vez de lanzador de instancias, y dos programas externos para asignar la carga sobre las instancias (map); y para recolectar los resultados parciales y producir un resultado integrado final (reduce). En ambos casos se trata de programas relativamente simples y que no demandan habilidades de programación paralela. Para validar y evaluar el sistema se han elegido dos aplicaciones representativas en el área de la bioinformática; una con un gran número de tareas independientes de pequeños volúmenes de datos (búsquedas por semejanza) y la otra con una sola tarea pero un gran volumen de datos (matrices de puntos). Estas aplicaciones presentan muchas de las características de los procesos actuales en genómica; elevada E-S, gran consumo de memoria y demanda de CPU. Su evaluación nos proporciona información importante para portar al entorno un gran conjunto de aplicaciones con estructura computacional similar. II. MÉTODOS Y SISTEMAS A. El gestor de instancias El diseño del esquema de gestión de la ejecución paralela de programas secuenciales se ha representado en la figura 1. Un proceso maestro es el encargado de la creación de las instancias (servidores) que a su vez

2 invocan al proceso secuencial de acuerdo a las especificación que el maestro ha leído del fichero de mapeo. Los procesos secuenciales ejecutan trabajos parciales e informan de su finalización al servidor quien maneja sus comunicaciones con el maestro, y quien a la finalización de todos los procesos servidores invoca el proceso de reducción o recolección de resultados parciales. Una secuencia genómica S n es una cadena de símbolos {x 1, x 2,..., x n } que pertenecen al alfabeto del ADN (x i A {A, C, G, T}). La matriz de puntos es uno de los métodos más antiguos de comparación de secuencias moleculares [11]. En términos simples, se trata de una representación visual del parecido entre dos secuencias. Una se dispone en horizontal y la otra en vertical y la matriz de puntos se construye comparando cada símbolo de ambas secuencias, ubicando un punto en la celda de intersección de coordenadas cuando los elementos son iguales. De esta forma, las regiones de las secuencias que comparten un parecido sustancial aparecerán como fragmentos diagonales en la matriz. El método estándar para reducir el ruido de los parecidos aleatorios de pequeños fragmentos utiliza una ventana deslizante de un determinado tamaño, de forma que solo resulte en un punto los fragmentos en la ventana cuyo parecido supere un umbral prefijado. Hay muchas y antiguas extensiones a esta metodología básica, que incluyen la fijación interactiva del umbral [12], [13], filtros estadísticos y el uso de diversos símbolos para discriminar las señales [14], el uso de colores para representar la información [15], y se ha extendido la capacidad interactiva [16, 17], incluyendo aplicaciones Web [11], con las típicas capacidades de navegación. Fig. 1. En la parte superior se esquematiza el proceso de asignación o distribución de la carga (map) y la generación de los scripts de ejecución. Un proceso maestro con los respectivos servidores, en el centro, se encargan de realizar las tareas parciales; para finalmente en un proceso de reducción producir el resultado integrado final (reduce). Tanto los procesos de distribución de recursos como los de colección de resultados se especifican a través de ficheros que pueden ser producidos automáticamente por pequeños y simples programas de distribucióncolección de la carga. Estos son los únicos programas que necesitan ser escritos para completar el sistema y muchas veces corresponden a conjuntos o lotes de comandos del sistema operativo. El proceso maestro está preparado para ser tolerante a los fallos de procesos, redistribuyendo la carga no resuelta y para lanzar la totalidad de las instancias por partes o etapas de acuerdo a los recursos disponibles. Ello permite el diseño con distribuciones de carga de tamaño variable a fin de reducir el coste de planificación, y mejorar la sincronización final de los procesos para tareas de baja regularidad. B. Las aplicaciones a implementar 1) Las matrices de puntos Estas referencias nos permiten analizar algunos aspectos computacionales. Estrictamente hablando, la propuesta inicial que realiza la comparación a nivel de símbolo, no requiere las secuencias ni la matriz de puntos en memoria. Bastaría con tener una de las secuencias o parte de ella en memoria e ir trabajando un símbolo a la vez de la segunda secuencia, para mostrar en una pantalla un punto o no. Sin embargo, ya el uso de la ventana deslizante requiere al menos parte de la segunda secuencia en memoria. Finalmente, la interactividad sobre la matriz de resultados requiere que las aplicaciones gestionen la matriz de puntos en memoria. Esto era posible porque se trabajaba sobre las secuencias relativamente pequeñas que se disponían (genes o genomas de pequeños virus de algunos pocos KB). Sin embargo, hoy en día se dispone de información de genomas completos de organismos superiores, entre ellos el humano, con algunos GB de símbolos (el genoma humano sobrepasa los 3 GB y sus cromosomas son de algunos cientos de MB). Aún por separado, tanto el cálculo como la visualización de la matriz de puntos representan grandes retos computacionales. Por ejemplo, la comparación de dos genomas medios de bacterias de 3 Mb, en un equipo capaz de comparar 100 MB, usando una ventana de un solo símbolo necesitaría alrededor de 25 horas, [16]. Cada incremento de una unidad en el tamaño de la ventana representaría un día más de tiempo de computación. Por otra parte, las aplicaciones de análisis interactivo requieren la matriz en memoria. En [18] propusimos gestionar la matriz a distintos niveles de resolución llegando a manejar matrices con algunos, notables para su momento, cientos de KB de longitud. Más adelante, en [15] se

3 presenta una aplicación para visualizar grandes alineamientos y en [19], se hizo en Web. 2) Comparación de secuencias biológicas La comparación de secuencias biológicas es posiblemente la aplicación de mayor uso en bioinformática. En esencia, dada una secuencia problema y una colección de secuencias conocidas, se trata de identificar aquellas secuencias en la colección que más se parezcan a la secuencia problema. De estas relaciones se pueden inferir relaciones evolutivas, estructurales o funcionales entre las secuencias. En términos más formales, dada una secuencia S Q y un conjunto de secuencias D = {S 1, S 2,..., S n } se debe comparar S Q contra cada una de las secuencias del conjunto D a fin de identificar aquellas S i, i {1 n}. III. RESULTADOS A. Los procesos de distribución y reducción Los procesos de asignación de carga a procesos (Map) y colección de resultados (Reduce) se han diseñado para que puedan ser preparados de forma externa tanto a la aplicación secuencial como al gestor de la ejecución. En el primer caso de estudio, la matriz de puntos se construye para dos secuencias S x y S y, por lo que la distribución de carga más simple es la de repartir el espacio computacional L x L y, donde L x y L y son las longitudes de las secuencias respectivas. Para ello, se parte cada una de las secuencias en N x y N y trozos para luego invocar el programa para cada combinación S i y S j i=1... N x ; y j=1...n y ), lo que producirá resultados parciales RES(i,j) que serán unidos por un proceso de Reducción para producir la super-matriz final. Es interesante indicar que este proceso genera además los scripts que permiten lanzar directamente las instancias (incluso en una máquina monoprocesadora). que las tareas que involucren a las secuencias largas gobernarán la eficiencia del sistema. Por ello, la distribución de la base de datos (conjunto conocido de secuencias) no solo es importante, sino que debe realizarse de forma que minimice la latencia de inicio (con mínimo de lanzamiento de instancias) y facilite la sincronización de finalización mediante, en ambos casos, de las tareas livianas al inicio y final del procesamiento en paralelo. El coste de planificación está asociado al número de tareas a distribuir (en nuestro caso especialmente por la latencia de lanzar una nueva instancia) y al tamaño de las últimas tareas a distribuir. La planificación guiada (Guided Self Scheduling) se planteó este problema. Dado un número n de instancias a crear en paralelo, la mejor solución en la que permite a todas las instancias finalizar con una diferencia máxima de B unidades de tiempo, siendo B el tiempo necesario para realizar un bloque básico de tareas. El razonamiento es el de asignar en la i-ésima distribución x i bloques, dejando suficientes bloques para distribuir a los n-1 instancias. Para conseguirlo, sea N el número de bloques de tareas, entonces x i queda definido por: x i = R i / n R i+1 = R i - x i donde R 1 = N Nosotros propusimos una modificación de esta distribución bajo la observación de que las tareas grandes que se generan en las primera iteraciones (ver tabla 1) produce una gran latencia tanto por el lanzamiento de la instancia pero especialmente por la llegada de los datos, llegando a producir incluso TABLA 1 TAMAÑOS DE LOS BLOQUES A DISTRIBUIR USANDO GSS Y NUESTRO GSS MODIFICADO (GSS-MOD) PARA N=100 Y 4 PROCESADORES. El segundo caso, búsquedas de secuencias por semejanza, presenta dos variantes. Una primera se presenta cuando se dispone de varias secuencias S Q (Q=1...N) y por tanto la primera distribución es la de repartir cada una de las secuencias a cada proceso. En el segundo caso se trata de procesar una sola secuencia S Q que se compara contra todas las secuencias del conjunto, por lo que en este caso lo natural es distribuir la colección de secuencias. Se debe observar que ambas soluciones pueden a su vez combinarse para formar una tercera opción que consistiría en separar secuencias y distribuir también el conjunto de secuencias conocidas. Es importante destacar que la primera variante puede presentar serios problemas de eficiencia cuando el número de secuencias problema (S Q ) es muy pequeño, y cuando las diferencias de longitud de las secuencias en dicho conjunto sean significativas, lo que supone

4 inanición en las últimas instancias (este hecho fue confirmado en los experimentos del trabajo de Google [10]). Estas modificaciones se traducen en los siguiente cálculos: x i = R i / n x -i+1 = x i R i+1 = R i - x i siendo R 1 = N / 2 B. Evaluación Para evaluar la solución propuesta hemos utilizado el cluster de la Red Española de Supercomputación, ubicado en el Centro de Bioinnovación de la Universidad de Málaga. Este cluster de memoria distribuida de la marca IBM está compuesto por 256 nodos JS20-IBM, cada nodo con 2 CPU IBM PowerPC single-core 970FX de 64bits a 2GHz, y 1 TB de memoria distribuida. La programación se ha realizado en C, usando la librería de paso de mensajes MPI. Para las primeras pruebas realizadas sobre la aplicación de matrices de puntos, se han usado dos secuencias de aproximadamente 1 MB de longitud, de las cepas APS y BPS de la bacteria Buchnera aphidicola (el primer genoma eucariota secuenciado en España); y también variaciones en tamaño de estas secuencias para observar el comportamiento con referencia al espacio computacional a distribuir. Para la segunda aplicación se ha seleccionado un conjunto de secuencias de la base de datos swissprot (80 mil secuencias) y se han seleccionado de ella 100 secuencias que serán usadas como conjunto problema (estas secuencias fueron a su vez eliminadas del conjunto conocido de secuencias). En cada una de las pruebas se han utilizado diferente número de instancias de los procesos a fin de evaluar la escalabilidad. La tabla 2 muestra los resultados de las pruebas donde se puede apreciar que se han utilizado distintos tamaños para validar la eficacia de la propuesta ante diferentes tamaños de carga. Fig. 2. Composición de los resultados parciales del proceso de la matriz de puntos, utilizando para ello dos secuencias de 2 y 3KB de longitud con diferente particionado. matrices parciales que conforman la matriz de punto de dos secuencias, obtenidas por seis procesos diferentes. Finalmente en la figura 3 se muestran los tiempos y la gráfica de aceleración correspondientes para los tests realizados. Para la aplicación de las Matrices de Puntos, se han usado los genomas de las bacterias Buchnera TABLA 2 DETALLES DE LOS CONJUNTOS DE PRUEBA. TAMAÑO DE LAS SECUENCIAS EN LOS DOTPLOTS Y DE LOS CONJUNTOS PROBLEMA EN LAS BÚSQUEDAS POR SEMEJANZA. ACELERACIÓN 2 PE 4 PE 8 PE 16 PE 32 PE 64 PE Óptima 2,00 4,00 8,00 16,00 32,00 64,00 Dotplot Buchnera 2,00 3,87 7,58 14,17 25,13 53,06 Frag. E.Coli y B.Subtilis 1,96 3,80 7,84 15,84 31,04 61,44 Fragmentos Buchnera 1,95 3,78 8,00 16,00 31,68 59,58 Blast singletons 1,98 3,96 7,88 15,74 30,86 56,66 Los programas se han comprobado a fin de confirmar que reproducen los resultados originales como se muestra en la figura 2, en la que se muestran las seis Fig.3. Resultados de aceleración en las implementaciones propuestas, en las que se observa un comportamiento cercano al ideal tanto para el proceso de la matriz de puntos, para la obtención de todos los fragmentos mayores que una longitud mínima (a partir de ahora, Fragmentos), y para el Blast en ejecuciones de casos reales. Para el caso de los Dotplots y Fragmentos, estos resultados corresponden a las secuencias Buchnera APS y BPS (600 KB), mientras que para Blast se han utilizado un conjunto de contigs y singletons que hacen las veces de secuencias problema. Para conjuntos de datos mayores, los resultados son incluso mejores, demostrando la escalabilidad de la solución, tal y como se puede ver en la ejecución de Fragmentos para las bacterias E. Coli (4,5 MB) y B. Subtilis (4,1 MB). Para datos de tiempos, ver la tabla 3.

5 TABLA 3 DETALLES DE LOS DATOS DE TIEMPO ASOCIADOS A LAS IMPLEMENTACIONES PROPUESTAS (CONTINUACIÓN FIGURA 3). Dotplot Buchnera TIEMPO 2 PE 4 PE 8 PE 16 PE 32 PE 64 PE Óptimo 03:21:48 01:40:54 00:50:27 00:25:14 00:12:37 00:06:19 Map-Reduce 03:19:47 01:44:17 00:53:07 00:30:00 00:15:20 00:07:24 Fragmentos E. Coli y B. Óptimo 50:40:00 25:20:00 12:40:00 06:20:00 03:10:00 01:35:00 Subtilis Map-Reduce 51:40:00 26:40:00 12:49:25 06:21:40 03:14:50 01:38:00 Fragmentos Buchnera Blast singletons Óptimo 01:05:00 00:32:30 00:16:15 00:08:08 00:04:04 00:02:02 Map-Reduce 01:06:37 00:34:17 00:16:15 00:08:08 00:04:06 00:02:10 Óptimo 00:58:10 00:29:05 00:14:33 00:07:17 00:03:39 00:01:50 Map-Reduce 00:58:37 00:29:21 00:14:46 00:07:24 00:03:47 00:02:02 APS y BPS de algo más de 600 KB de longitud; mientras que en las Comparaciones por Semejanza, se han utilizado secuencias (singletons procedentes de un proceso de ensamblaje) que son contrastadas contra grupos (contigs) de secuencias. También se han realizado pruebas con una carga de datos mayor como son las bacterias E. Coli y B. Subtilis de más de 4 MB de longitud mediante la comparación por semejanza. Los resultados indican que estas implementaciones escalan linealmente con el número de procesadores con aceleraciones cercanas a la máxima. Se ha probado el rendimiento para volúmenes de datos o carga computacional menor, y como cabría esperar, cuando el número de procesadores crece, la carga por proceso no es suficiente para compensar la latencia de inicio de los procesos y, por tanto, el número de procesadores debe fijarse en función de la carga para alcanzar buenos rendimientos. IV. CONCLUSIONES La computación en la Cloud abre nuevas oportunidades para acercar la computación de alto rendimiento a laboratorios que requieren procesar grandes cantidades de datos pero que no disponen de infraestructura computacional adecuada. Por otra parte, la bioinformática ha despegado como una línea de investigación en la que el desarrollo de software tiene que lidiar con el problema de los grandes conjuntos de datos. Existe una gran diversidad de aplicaciones en este campo, pero en su práctica totalidad están preparadas para una ejecución secuencial y unas condiciones que ya han dejado de estar presentes. Este documento se centra en el desarrollo de un marco de trabajo que permita la reutilización de estas aplicaciones en entornos paralelos, exigiendo que no se toque el código secuencial ya que muchas de ellas son aplicaciones bastante antiguas aunque válidas (legacy applications). El desarrollo es en idea sencillo, aunque requiere una programación eficiente y cuidadosa para manejar situaciones de conflicto, como es el fallo de procesos, su sincronización, y el balanceo de la carga. Los mayores problemas encontrados, como era de esperar, han sido en el ámbito de la E-S. Para el caso de redes de ordenadores, siempre es posible utilizar los discos locales para evitar el cuello de botella en el sistema de almacenamiento al concurrir a él cientos y potencialmente miles de procesos. Cuando no se dispone de este sistema distribuido de almacenamiento, el cuello de botella impide escalar bien a la aplicación. Por ello en algunos casos es necesario abordar tanto la reformulación como el diseño de nuevo software. También es cierto que el sistema es válido para aplicaciones que deben llevar adelante una serie de tareas más o menos homogéneas y que procesos de una sola tarea y con grandes dependencias de datos, son en principio difíciles de adecuar a este entorno. Sin embargo, una estimación realizada en nuestro grupo, calcula que no más del 20% de los programas bioinformáticos tienen este diseño, por lo que la aproximación sigue siendo válida para el gran porcentaje de aplicaciones bioinformáticas. Aunque las aplicaciones presentadas en este documento tienen un patrón de cálculo bastante regular (en el caso de los dotplots se ha usado un código de fuerza bruta) la introducción de heterogeneidad en las tareas (que no la de interdependencias) es aún manejable vía el uso de una distribución de carga más inteligente (guiada, por ejemplo) con resultados satisfactorios. Por tanto, no hay dependencia con la optimización de los cálculos que puedan introducir nuevas versiones de los algoritmos. Finalmente, el desarrollo de este entorno de trabajo permitirá llevar a una ejecución paralela a cientos de programas en el ámbito bioinformático, abriendo nuevas oportunidades para el análisis de datos y para la ciencia en general. AGRADECIMIENTOS Este trabajo ha sido parcialmente financiado por el Instituto Nacional de Bioinformática, plataforma del Instituto de Salud Carlos III; la Acción Integrada del Programa Nacional de Internacionalización de la I+D; Subprograma: Acciones Integradas 2009; Ministerio de Ciencia e Innovación. Referencia AT y el programa Virtual Multidisciplinary EnviroNments USing Cloud Infrastructures, FP7-VENUS-C (www.venus-c.eu). REFERENCIAS [1] Armbrust M, Fox, et al. Above the Clouds: A Berkeley View of Cloud Computing. Technical report

6 [http://www.eecs.berkeley.edu/pubs/techrpts/2009/eecs pdf]. [2] Press Release: Gartner s 2009 Hype Cycle Special Report Evaluates Maturity of 1,650 Technologies. [http://www.gartner.com/it/page.jsp?id= ]. [3] Google App.Engine: Welcome to the Google Apps; [4] What is the Windows Azure platform?; [5] IBM smart Cloud: [6] Amazon Elastic Compute Cloud: [7] Amazon. Build a Cluster Computing Environment in under 10 minutes. 10/ [8] Editorial, Big data: Welcome to the petacentre, Nature 455, (2008) doi: /455016a [9] 1000 Genomes: A Deep Catalog of Human Genetic Variation (http://www.1000genomes.org). [10] Dean, J. and Ghemawat, S. MapReduce: simplified data processing on large clusters. "Comm. ACM", 51, ), [11 Gibbs, A.J. and McIntyre, G.A. The Diagram, a Method for Comparing Sequences, Its Use with Amino Acid and Nucleotide Sequences. European J. Biochemistry, vol. 16, pp. 1-11, [12] Maizel, J.V. and Lenk, R.P. Enhanced Graphic Matrix Analysis of Nucleic Acid and Protein Sequences. Proceedings of the National Academy of Science, USA 78, 12, [13] Staden, R. An interactive graphics program for comparing and aligning nucleic acid and amino acid sequences, Nucleic Acids Research, 1982, Vol. 10, No [14] Pustell and Kafatos, 1984J. Pustell and F.C. Kafatos, A convenient and adaptable package of computer programs for DNA and protein sequence management, analysis and homology determination, Nucl. Acids Res. 12 (1984), pp [15] Reisner, H and Bucholtz. The use of various properties of amino acids in color and monochrome dot-matrix analyses for protein homologies. Bioinformatics, Volume 4, Number 3Pp [16] Nedde, D.N. and Ward, M.O. Visualizing relationships between nucleic acid sequences using correlation images. CABIOS, 9(3): [17] Trelles-Salazar, O.; Zapata, E.L.; Dopazo, J.; Coulson, A.W.F and Carazo, J.M. An Image processing approach to DotPlots : An X window-based program for interactive analysis of dotplots derived from sequence and structural data, CABIOS (11) 3: [18] Schwartz,S PipMaker- a web server for aligning two genomic DNA sequences. Genome Res., 10, , [19] Trelles-Salazar, O.; Zapata, E.L.; Dopazo, J.; Coulson, A.W.F and J.M.Carazo. An Image processing approach to DotPlots : An X window-based program for interactive analysis of dotplots derived from sequence and structural data, CABIOS (11) 3:

Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la

Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la ejecución de programas secuenciales de forma paralela con el requisito de no modificar los programas secuenciales. La idea fundamental

Más detalles

Diseño del Sistema de Información

Diseño del Sistema de Información Diseño del Sistema de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS...2 ACTIVIDAD DSI 1: DEFINICIÓN DE LA ARQUITECTURA DEL SISTEMA...7 Tarea DSI 1.1: Definición de Niveles de Arquitectura...9 Tarea DSI 1.2:

Más detalles

CURSOS DE VERANO 2014

CURSOS DE VERANO 2014 CURSOS DE VERANO 2014 CLOUD COMPUTING: LA INFORMÁTICA COMO SERVICIO EN INTERNET LA PLATAFORMA GOOGLE CLOUD PLATFORM. GOOGLE APP ENGINE Pedro A. Castillo Valdivieso Universidad de Granada http://bit.ly/unia2014

Más detalles

CENTRO DE RESGUARDO ARQUITECTURA AVANZADA PROF.: JUAN JOSÉ MUÑOZ BUSSI AUTOR: MARIANA FERRETTO

CENTRO DE RESGUARDO ARQUITECTURA AVANZADA PROF.: JUAN JOSÉ MUÑOZ BUSSI AUTOR: MARIANA FERRETTO CENTRO DE RESGUARDO ARQUITECTURA AVANZADA PROF.: JUAN JOSÉ MUÑOZ BUSSI AUTOR: MARIANA FERRETTO CENTRO DE RESGUARDO Centro de Cómputos de Resguardo Sitio para reubicarse luego de un desastre Sitio manejado

Más detalles

PCI 2010 Acción Preparatoria. Computación Avanzada en Aplicaciones Biomédicas. (High Performance Computing applied to Life Sciences)

PCI 2010 Acción Preparatoria. Computación Avanzada en Aplicaciones Biomédicas. (High Performance Computing applied to Life Sciences) PCI 2010 Acción Preparatoria Computación Avanzada en Aplicaciones Biomédicas CaaB (High Performance Computing applied to Life Sciences) Descripción general Participantes Universidad de Málaga, España CIEMAT,

Más detalles

PROYECTO REALIZADO POR: ENTIDAD GESTORA: COFINANCIADO POR:

PROYECTO REALIZADO POR: ENTIDAD GESTORA: COFINANCIADO POR: CLOUD COMPUTING PROYECTO REALIZADO POR: ENTIDAD GESTORA: COFINANCIADO POR: 1. Introducción 1. Qué es el Cloud Computing? La computación en nube es un sistema informático basado en Internet y centros de

Más detalles

Diseño del Sistema de Información

Diseño del Sistema de Información Diseño del Sistema de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 2 ACTIVIDAD DSI 1: DEFINICIÓN DE LA ARQUITECTURA DEL SISTEMA... 7 Tarea DSI 1.1: Definición de Niveles de Arquitectura... 9 Tarea DSI

Más detalles

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Big Data: retos a nivel de desarrollo Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Cámara de Comercio de Bogotá Centro Empresarial Chapinero Agenda Introducción Bases de datos NoSQL Procesamiento

Más detalles

La filosofía open source en la bioinformática

La filosofía open source en la bioinformática 03-09-2009 La filosofía open source en la bioinformática Desde hace una década el fenómeno open source o código abierto ha explotado y sus efectos se pueden ver en todas partes y también en la ciencia.

Más detalles

CA Mainframe Chorus for DB2 Database Management versión 2.0

CA Mainframe Chorus for DB2 Database Management versión 2.0 HOJA DE PRODUCTO CA Mainframe Chorus for DB2 Database Management CA Mainframe Chorus for DB2 Database Management versión 2.0 Simplifique y dinamice su DB2 para tareas de administración de cargas de trabajo

Más detalles

Módulo: Modelos de programación para Big Data

Módulo: Modelos de programación para Big Data Program. paralela/distribuida Módulo: Modelos de programación para Big Data (título original: Entornos de programación paralela basados en modelos/paradigmas) Fernando Pérez Costoya Introducción Big Data

Más detalles

Cloud Computing. Rodrigo Moreno Rosales DN-11

Cloud Computing. Rodrigo Moreno Rosales DN-11 Cloud Computing Rodrigo Moreno Rosales DN-11 Cloud Computing La computación en la nube,conocido también como servicios en la nube, informática en la nube, nube de cómputo o nube de conceptos, es un paradigma

Más detalles

MS_20247 Configuring and Deploying a Private Cloud

MS_20247 Configuring and Deploying a Private Cloud Gold Learning Gold Business Intelligence Silver Data Plataform Configuring and Deploying a Private Cloud www.ked.com.mx Por favor no imprimas este documento si no es necesario. Introducción. Este curso

Más detalles

GPU IMPLEMENTATIONS OF SCHEDULING HEURISTICS FOR HETEROGENEOUS COMPUTING ENVIRONMENTS

GPU IMPLEMENTATIONS OF SCHEDULING HEURISTICS FOR HETEROGENEOUS COMPUTING ENVIRONMENTS GPU IMPLEMENTATIONS OF SCHEDULING HEURISTICS FOR HETEROGENEOUS COMPUTING ENVIRONMENTS MAURO CANABÉ SERGIO NESMACHNOW Centro de Cálculo, Facultad de Ingeniería Universidad de la República, Uruguay GPU IMPLEMENTATIONS

Más detalles

Acerca de esté Catálogo

Acerca de esté Catálogo Catálogo de Cursos 2015 Acerca de esté Catálogo En el presente documento podrá obtenerse la información necesaria sobre la oferta de cursos que Manar Technologies S.A.S. y su línea de educación Campus

Más detalles

CLOUD AND SKY COMPUTING

CLOUD AND SKY COMPUTING Universidad Simón Bolívar Sistemas de Operación III (CI-4822) Septiembre Diciembre 2013 CLOUD AND SKY COMPUTING Carlos Gómez Pedro Romero TEMAS Cloud Computing Historia Concepto Características Arquitectura

Más detalles

CURSOS DE VERANO 2014

CURSOS DE VERANO 2014 CURSOS DE VERANO 2014 CLOUD COMPUTING: LA INFORMÁTICA COMO SERVICIO EN INTERNET La plataforma Google Cloud Platform. Google App Engine Pedro A. Castillo Valdivieso Universidad de Granada La plataforma

Más detalles

Arquitectura de Aplicaciones

Arquitectura de Aplicaciones 1 Capítulo 13: Arquitectura de aplicaciones. - Sommerville Contenidos del capítulo 13.1 Sistemas de procesamiento de datos 13.2 Sistemas de procesamiento de transacciones 13.3 Sistemas de procesamiento

Más detalles

SBDA-GRID: implementación de un servicio de base de datos en una arquitectura grid

SBDA-GRID: implementación de un servicio de base de datos en una arquitectura grid SBDA-GRID: implementación de un servicio de base de datos en una arquitectura grid Nancy Ocotitla Rojas, Axel E. Moreno Cervantes, Rogelio Castro González Escuela Superior de Cómputo-IPN, Av. Juan de Dios

Más detalles

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente En este capítulo definimos los requisitos del modelo para un sistema centrado en la mejora de la calidad del código fuente.

Más detalles

EMC SCALEIO SAN de servidor convergente definida por software

EMC SCALEIO SAN de servidor convergente definida por software EMC SCALEIO SAN de servidor convergente definida por software ASPECTOS FUNDAMENTALES Solo para software Arquitectura convergente de capa simple Escalabilidad lineal Rendimiento y capacidad según demanda

Más detalles

PROGRAMA FORMATIVO Virtualización, computación en la nube y alta disponibilidad con Oracle Solaris

PROGRAMA FORMATIVO Virtualización, computación en la nube y alta disponibilidad con Oracle Solaris PROGRAMA FORMATIVO Virtualización, computación en la nube y alta disponibilidad con Oracle Solaris Julio 2014 DATOS GENERALES DE LA ESPECIALIDAD 1. Familia Profesional: INFORMÁTICA Y COMUNICACIONES Área

Más detalles

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio?

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio? Qué es Doopex? Big Data en la nube. Use los datos. Obtenga información. Seguramente, la pregunta clave no es Qué es Doopex?. La pregunta clave es: Qué puede hacer Doopex por mi negocio? El objetivo de

Más detalles

Metodología y Framework para el Desarrollo de Aplicaciones Científicas con Computación de Alto Rendimiento a través de Servicios Web

Metodología y Framework para el Desarrollo de Aplicaciones Científicas con Computación de Alto Rendimiento a través de Servicios Web Metodología y Framework para el Desarrollo de Aplicaciones Científicas con Computación de Alto Rendimiento a través de Servicios Web J.Corral-García, D.Cortés-Polo, C.Gómez-Martín, J.L.González-Sánchez

Más detalles

SEDA. Servicio Ejecución Distribuida de Aplicaciones. Dossier de Presentación. Versión 1.0

SEDA. Servicio Ejecución Distribuida de Aplicaciones. Dossier de Presentación. Versión 1.0 SEDA Servicio Ejecución Distribuida de Aplicaciones Dossier de Presentación Versión 1.0 2 SEDA Edificio RD Sistemas 1 ÍNDICE 1 ÍNDICE 3 2 EVOLUCIÓN TECNOLÓGICA DE RDSISTEMAS5 3 ARQUITECTURA SEDA 6 3.1

Más detalles

Servicios avanzados de supercomputación para la ciència y la ingeniería

Servicios avanzados de supercomputación para la ciència y la ingeniería Servicios avanzados de supercomputación para la ciència y la ingeniería Servicios avanzados de supercomputación para la ciència y la ingeniería HPCNow! provee a sus clientes de la tecnología y soluciones

Más detalles

Soluciones para entornos HPC

Soluciones para entornos HPC Dr.. IT Manager / Project Leader @ CETA-Ciemat abelfrancisco.paz@ciemat.es V Jornadas de Supercomputación y Avances en Tecnología INDICE 1 2 3 4 HPC Qué? Cómo?..................... Computación (GPGPU,

Más detalles

Intel Tera-Scale Computing Alumno: Roberto Rodriguez Alcala

Intel Tera-Scale Computing Alumno: Roberto Rodriguez Alcala Intel Tera-Scale Computing Alumno: Roberto Rodriguez Alcala 1. Introducción Los procesadores con dos núcleos existen actualmente, y los procesadores de cuatro están insertándose en el mercado lentamente,

Más detalles

Transición de su infraestructura de Windows Server 2003 a una solución moderna de Cisco y Microsoft

Transición de su infraestructura de Windows Server 2003 a una solución moderna de Cisco y Microsoft Descripción general de la solución Transición de su infraestructura de Windows Server 2003 a una solución moderna de Cisco y Microsoft El soporte de Microsoft para todas las versiones de Windows Server

Más detalles

WebSphere Extended Deployment

WebSphere Extended Deployment IBM Software Group WebSphere Extended Deployment Gestión de Efectividad y Capacidad Agenda WebSphere Extended Deployment: Introducción Dynamic Operations Extended Manageability High Performance Computing

Más detalles

III. INTRODUCCIÓN AL CLOUD COMPUTING

III. INTRODUCCIÓN AL CLOUD COMPUTING III. INTRODUCCIÓN AL CLOUD COMPUTING Definición (I) Qué es el cloud computing? Nuevo paradigma de computación distribuida Provee un servicio de acceso a recursos computacionales: servidores, almacenamiento,

Más detalles

Ficha Técnica del curso Online de Cloud Computing con Amazon Web Services (AWS)

Ficha Técnica del curso Online de Cloud Computing con Amazon Web Services (AWS) Ficha Técnica del curso Online de Cloud Computing con Amazon Web Services (AWS) Nombre del Curso: Curso Online de Cloud Computing con Amazon Web Services (AWS) Breve descripción del Curso: Este curso online

Más detalles

BIG DATA. Jorge Mercado. Software Quality Engineer

BIG DATA. Jorge Mercado. Software Quality Engineer BIG DATA Jorge Mercado Software Quality Engineer Agenda Big Data - Introducción Big Data - Estructura Big Data - Soluciones Conclusiones Q&A Big Data - Introducción Que es Big Data? Big data es el termino

Más detalles

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928 Alessandro Chacón 05-38019 Ernesto Level 05-38402 Ricardo Santana 05-38928 CONTENIDO Universo Digital Hadoop HDFS: Hadoop Distributed File System MapReduce UNIVERSO DIGITAL 161 EB 2006 Fuente: International

Más detalles

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS Introducción Los algoritmos utilizados para el procesamiento de imágenes son de complejidad computacional alta. Por esto

Más detalles

CA Automation Suite for Hybrid Clouds

CA Automation Suite for Hybrid Clouds HOJA DEL PRODUCTO: For Hybrid Clouds for Hybrid Clouds for Hybrid Clouds está diseñada para aumentar la agilidad y la eficacia, de forma que pueda hacer lo siguiente: Sobrellevar las ráfagas de demanda

Más detalles

GESTIÓN DE CAPACIDAD DE SERVICIOS TI: UNA SOLUCIÓN DESDE ITIL

GESTIÓN DE CAPACIDAD DE SERVICIOS TI: UNA SOLUCIÓN DESDE ITIL GESTIÓN DE CAPACIDAD DE SERVICIOS TI: UNA SOLUCIÓN DESDE ITIL Consultor Senior de Calidad SW Métodos y Tecnología Responsable de Área Ingeniería y Calidad SW Métodos y Tecnología 1 Palabras clave ITIL,

Más detalles

13º Unidad Didáctica. RAID (Redundant Array of Independent Disks) Eduard Lara

13º Unidad Didáctica. RAID (Redundant Array of Independent Disks) Eduard Lara 13º Unidad Didáctica RAID (Redundant Array of Independent Disks) Eduard Lara 1 RAID: INTRODUCCIÓN Sistema de almacenamiento que usa múltiples discos duros entre los que distribuye o replica los datos.

Más detalles

ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA

ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA ARQUITECTURA ESCALABLE PARA LA DETECCIÓN DE PATRONES SECUENCIALES DIFUSOS EN MINERÍA DE DATOS CUANTITATIVA Pablo F. Provasi 1 Lucio J. Kleisinger 1 Francisco R. Villatoro 2 1 Dpto. de Informática, Universidad

Más detalles

Programación híbrida en arquitecturas cluster de multicore. Escalabilidad y comparación con memoria compartida y pasaje de mensajes.

Programación híbrida en arquitecturas cluster de multicore. Escalabilidad y comparación con memoria compartida y pasaje de mensajes. Programación híbrida en arquitecturas cluster de multicore. Escalabilidad y comparación con memoria compartida y pasaje de mensajes. Fabiana Leibovich, Armando De Giusti, Marcelo Naiouf, Laura De Giusti,

Más detalles

Windows 2000 Server. Manual de Windows 2000 Server

Windows 2000 Server. Manual de Windows 2000 Server Windows 2000 Server Proyecto Huascarán - Ministerio de Educación Dirección de Informática y Telecomunicaciones Área de Informática y Redes Diseño y Elaboración: Carlos A. Anchante Ch. Windows 2000 Server

Más detalles

DESKTOP GRID Y COMPUTACIÓN VOLUNTARIA: INTRODUCCIÓN A LA TECNOLOGÍA BOINC

DESKTOP GRID Y COMPUTACIÓN VOLUNTARIA: INTRODUCCIÓN A LA TECNOLOGÍA BOINC DESKTOP GRID Y COMPUTACIÓN VOLUNTARIA: INTRODUCCIÓN A LA TECNOLOGÍA BOINC José Luis Guisado Lizar http://cum.unex.es/profes/profes/jlguisado Grupo de Evolución Artificial (GEA) Universidad de Extremadura

Más detalles

Paso a paso hacia el Cloud

Paso a paso hacia el Cloud Claranet Qué factores considerar antes de dar el paso Claranet S. A. U. - Juan Gris, 10-18, planta 4, torres cerdà - 08014 Barcelona Tel: 902 884 633 - Fax: +34 934 451 920 Email: info@claranet.es - Web:

Más detalles

[Webcast] Servicios de Cómputo en Azure. Implementación Avanzada de Cómputo en la Nube [Web App, Cloud Service y Virtual Machines]

[Webcast] Servicios de Cómputo en Azure. Implementación Avanzada de Cómputo en la Nube [Web App, Cloud Service y Virtual Machines] [Webcast] Servicios de Cómputo en Azure Implementación Avanzada de Cómputo en la Nube [Web App, Cloud Service y Virtual Machines] [Webcast] Servicios de Cómputo en Azure Implementación Avanzada de Cómputo

Más detalles

Servicios de infraestructura. Aplicaciones web

Servicios de infraestructura. Aplicaciones web 10 Julio 2013 Servicios de infraestructura Compílela o tráigala y nosotros la ejecutamos Windows Azure proporciona infraestructura a petición que se escala y se adapta a las necesidades cambiantes de cada

Más detalles

de qué manera se puede administrar la complejidad de los datos y mejorar la agilidad del negocio?

de qué manera se puede administrar la complejidad de los datos y mejorar la agilidad del negocio? RESUMEN DE LA SOLUCIÓN CA ERwin Modeling de qué manera se puede administrar la complejidad de los datos y mejorar la agilidad del negocio? agility made possible CA ERwin Modeling ofrece un entorno de modelado

Más detalles

MS_20488 Developing Microsoft SharePoint Server 2013 Core Solutions

MS_20488 Developing Microsoft SharePoint Server 2013 Core Solutions S MS_20488 Developing Microsoft SharePoint Server 2013 Core Solutions www.ked.com.mx Av. Revolución No. 374 Col. San Pedro de los Pinos, C.P. 03800, México, D.F. Tel/Fax: 52785560 Introducción En este

Más detalles

Qué necesito saber para tener mi sitio web en Internet?

Qué necesito saber para tener mi sitio web en Internet? Qué necesito saber para tener mi sitio web en Internet? Introducción Antes es importante tener en cuenta que Es importante considerar lo siguiente: Definir claramente tu actividad en Internet Establecer

Más detalles

2 Congreso Colombiano de Bioinformática y biología computacional.

2 Congreso Colombiano de Bioinformática y biología computacional. 2 Congreso Colombiano de Bioinformática y biología computacional. Presentación y evaluación de ABMS (Automatic Blast for Massive Annotation) Nelson Perez nelsonp@correo.udistrital.edu.co Cristian Rojas

Más detalles

Mantenimiento de Sistemas de Información

Mantenimiento de Sistemas de Información de Sistemas de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 1 ACTIVIDAD MSI 1: REGISTRO DE LA PETICIÓN...4 Tarea MSI 1.1: Registro de la Petición... 4 Tarea MSI 1.2: Asignación de la Petición... 5 ACTIVIDAD

Más detalles

Sybase IQ Servidor analítico con arquitectura basada en columnas

Sybase IQ Servidor analítico con arquitectura basada en columnas Sybase IQ Servidor analítico con arquitectura basada en columnas www.sybase.es Sybase IQ Descripción Tener acceso a toda la información de que dispone su organización, con el fin de analizarla no es hoy

Más detalles

Facultad de Ingeniería ISSN: 0121-1129 revista.ingenieria@uptc.edu.co. Universidad Pedagógica y Tecnológica de Colombia. Colombia

Facultad de Ingeniería ISSN: 0121-1129 revista.ingenieria@uptc.edu.co. Universidad Pedagógica y Tecnológica de Colombia. Colombia Facultad de Ingeniería ISSN: 0121-1129 revista.ingenieria@uptc.edu.co Universidad Pedagógica y Tecnológica de Colombia Colombia Amézquita-Mesa, Diego Germán; Amézquita-Becerra, Germán; Galindo-Parra, Omaira

Más detalles

MS_20416 Implementing Desktop Application Environments

MS_20416 Implementing Desktop Application Environments Implementing Desktop Application Environments www.ked.com.mx Av. Revolución No. 374 Col. San Pedro de los Pinos, C.P. 03800, México, D.F. Tel/Fax: 52785560 Introducción En este curso ayuda a construir

Más detalles

Plataformas Tecnológicas y Requerimientos Técnicos de las Aplicaciones de

Plataformas Tecnológicas y Requerimientos Técnicos de las Aplicaciones de Plataformas Tecnológicas y Requerimientos Técnicos de las Aplicaciones de Departamento de Sistemas 2014 Página 1 INDICE Introducción 3 Requisitos Generales del Entorno 3 Requisitos Generales de las Aplicaciones

Más detalles

SOLUCIÓN SITUACIÓN ACTUAL

SOLUCIÓN SITUACIÓN ACTUAL SITUACIÓN ACTUAL La necesidad de las organizaciones de ser más competitivas en un mercado dinámico ha generado estructuras organizacionales complejas y exigentes en términos de calidad y eficiencia. Sobre

Más detalles

Electrónica Digital II

Electrónica Digital II Electrónica Digital II M. C. Felipe Santiago Espinosa Aplicaciones de los FPLDs Octubre / 2014 Aplicaciones de los FPLDs Los primeros FPLDs se usaron para hacer partes de diseños que no correspondían a

Más detalles

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011 Clusters Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011 Introducción Aplicaciones que requieren: Grandes capacidades de cómputo: Física de partículas, aerodinámica, genómica, etc. Tradicionalmente

Más detalles

CLUSTER FING: PARALELISMO de MEMORIA DISTRIBUIDA

CLUSTER FING: PARALELISMO de MEMORIA DISTRIBUIDA CLUSTER FING: PARALELISMO de MEMORIA DISTRIBUIDA SERGIO NESMACHNOW Centro de Cálculo, Instituto de Computación FACULTAD DE INGENIERÍA, UNIVERSIDAD DE LA REPÚBLICA, URUGUAY CONTENIDO Introducción: arquitecturas

Más detalles

Gestión automatizada de la infraestructura (IaaS Infraestructure as a Service)

Gestión automatizada de la infraestructura (IaaS Infraestructure as a Service) Universidad de Extremadura (Observatorio Tecnológico HP) Escuela Politécnica de Cáceres Gestión automatizada de la infraestructura (IaaS Infraestructure as a Service) Autores: Emilio José Muñoz Fernández

Más detalles

Diplomado en Big Data

Diplomado en Big Data 160 horas Diplomado en Big Data BROCHURE, 2015 Contenido Quienes somos?... 3 Presentación del Programa... 4 Perfíl del Facilitador. 5 Objetivos.. 6 Información General.. 7 Plan de Estudio... 8-9 Plan de

Más detalles

MS_20246 Monitoring and Operating a Private Cloud

MS_20246 Monitoring and Operating a Private Cloud Gold Learning Gold Business Intelligence Silver Data Plataform Monitoring and Operating a Private Cloud www.ked.com.mx Por favor no imprimas este documento si no es necesario. Introducción. Este curso

Más detalles

EXPEDIENTE: 2/2015 ADQUISICIÓN E INSTALACIÓN DE INFRAESTRUCTURA CIENTÍFICA Y TECNOLÓGICA PARA CÉNITS PLIEGO DE PRESCRIPCIONES TÉCNICAS

EXPEDIENTE: 2/2015 ADQUISICIÓN E INSTALACIÓN DE INFRAESTRUCTURA CIENTÍFICA Y TECNOLÓGICA PARA CÉNITS PLIEGO DE PRESCRIPCIONES TÉCNICAS EXPEDIENTE: 2/2015 ADQUISICIÓN E INSTALACIÓN DE INFRAESTRUCTURA CIENTÍFICA Y TECNOLÓGICA PARA CÉNITS PLIEGO DE PRESCRIPCIONES TÉCNICAS PLIEGO DE PRESCRIPCIONES TÉCNICAS. EXPTE 2/2015 Adquisición e instalación

Más detalles

UNIVERSIDAD CARLOS III DE MADRID

UNIVERSIDAD CARLOS III DE MADRID : Grupo de Arquitectura de Computadores, Comunicaciones y Sistemas A R C O S I V E R S ID A D U N III I D R D A M D E I C A R L O S II UNIVERSIDAD CARLOS III DE MADRID Grupo de Arquitectura de Computadores,

Más detalles

CLUSTER FING: ARQUITECTURA Y APLICACIONES

CLUSTER FING: ARQUITECTURA Y APLICACIONES CLUSTER FING: ARQUITECTURA Y APLICACIONES SERGIO NESMACHNOW Centro de Cálculo, Instituto de Computación FACULTAD DE INGENIERÍA, UNIVERSIDAD DE LA REPÚBLICA, URUGUAY CONTENIDO Introducción Clusters Cluster

Más detalles

Cloud Computing Tendencias. Modelos. Posibilidades. Germán Cortés Lasso gcorteslasso@gmail.com

Cloud Computing Tendencias. Modelos. Posibilidades. Germán Cortés Lasso gcorteslasso@gmail.com Cloud Computing Tendencias. Modelos. Posibilidades Germán Cortés Lasso gcorteslasso@gmail.com Agenda Introducción Qué es Cloud Computing? Características Modelos Tendencias Posibilidades Introducción Todos

Más detalles

CAPÍTULO 5. Hemos utilizado la técnica de programación orientado a objetos por su

CAPÍTULO 5. Hemos utilizado la técnica de programación orientado a objetos por su 88 CAPÍTULO 5 5. IMPLEMENTACIÓN 5.1 Modelo Utilizado en Programación. Hemos utilizado la técnica de programación orientado a objetos por su eficiencia y eficacia en el modelo mvc, ya que permite la reutilización

Más detalles

Motores de Búsqueda Web Tarea Tema 2

Motores de Búsqueda Web Tarea Tema 2 Motores de Búsqueda Web Tarea Tema 2 71454586A Motores de Búsqueda Web Máster en Lenguajes y Sistemas Informáticos - Tecnologías del Lenguaje en la Web UNED 30/01/2011 Tarea Tema 2 Enunciado del ejercicio

Más detalles

Guía Rápida de Inicio

Guía Rápida de Inicio Guía Rápida de Inicio 1. Acerca de esta Guía Esta guía le ayudará a instalar y dar los primeros pasos con BitDefender Security for Exchange. Para disponer de instrucciones detalladas, por favor, diríjase

Más detalles

Escuela Técnica Superior de Ingenieros de Telecomunicación

Escuela Técnica Superior de Ingenieros de Telecomunicación Escuela Técnica Superior de Ingenieros de Telecomunicación Resumen del Proyecto Fin de Carrera Diseño y Desarrollo de un Teléfono Inalámbrico WiFi para VoIP Autor: Jorge Muñoz Castañer Tutor: Felipe Gil

Más detalles

LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS ELECTRÓNICOS

LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS ELECTRÓNICOS LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS Ministerio de Tecnologías de la Información y las Comunicaciones Programa de Gobierno

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS UNA SESIÓN EN SPSS INTRODUCCIÓN. SPSS (Statistical Product and Service Solutions) es un paquete estadístico orientado, en principio, al ámbito de aplicación de las Ciencias sociales, es uno de las herramientas

Más detalles

Windows Server Hyper-V

Windows Server Hyper-V Windows Server Diseño, implantación y administración La plataforma de virtualización de Microsoft La virtualización de servidores ha sido, en la última década, una de las principales áreas de inversión

Más detalles

BACKUP SERVIDOR IPLAN INTRODUCCIÓN AL SERVICIO

BACKUP SERVIDOR IPLAN INTRODUCCIÓN AL SERVICIO BACKUP SERVIDOR IPLAN INTRODUCCIÓN AL SERVICIO 1. INTRODUCCIÓN El presente instructivo tiene como objetivo introducir brevemente el servicio Backup Servidor IPLAN, a fin de que puedas conocer las caracteristicas

Más detalles

Arquitecturas de computadoras

Arquitecturas de computadoras Arquitecturas de computadoras Colaboratorio Nacional de Computación Avanzada (CNCA) 2014 Contenidos 1 Computadoras 2 Estación de Trabajo 3 Servidor 4 Cluster 5 Malla 6 Nube 7 Conclusiones Computadoras

Más detalles

Backup online empresarial Resumen de características técnicas 2015

Backup online empresarial Resumen de características técnicas 2015 2015 bedata En el mundo actual, el software de copia de seguridad en línea debe ser seguro, extremadamente fiable y ultra- rápido. Nuestra tecnología ofrece estas características críticas, lo que le permite

Más detalles

MS_20465 Designing Database Solutions for Microsoft SQL Server

MS_20465 Designing Database Solutions for Microsoft SQL Server Gold Learning Gold Business Intelligence Silver Data Plataform Designing Database Solutions for Microsoft SQL Server www.ked.com.mx Por favor no imprimas este documento si no es necesario. Introducción.

Más detalles

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Problemas con los sistemas tradicionales 3 Qué es Spark? 3.1 Procesamiento de datos distribuido

Más detalles

Bienvenidos a la presentación: Introducción a conceptos básicos de programación.

Bienvenidos a la presentación: Introducción a conceptos básicos de programación. Bienvenidos a la presentación: Introducción a conceptos básicos de programación. 1 Los programas de computadora son una serie de instrucciones que le dicen a una computadora qué hacer exactamente. Los

Más detalles

Análisis de sentimientos de tweets.

Análisis de sentimientos de tweets. Análisis de sentimientos de tweets. JIT-CITA 2013 Resumen Un sensor de sentimientos de tweets para identificar los mensajes positivos, negativos y neutros sobre cualquier trend que se tome sobre esta red

Más detalles

Tema 3. MODELOS. 2.1 Apoyo Informático a la investigación experimental. 2.2 Modelos del cerebro: A. Realistas biológicos.

Tema 3. MODELOS. 2.1 Apoyo Informático a la investigación experimental. 2.2 Modelos del cerebro: A. Realistas biológicos. Tema 3. MODELOS 011 0 01 01 FUNDAMENTOS 1. Modelos computacionales. 2. Computación y Neurociencia. CONTENIDOS 2.1 Apoyo Informático a la investigación experimental. 2.2 Modelos del cerebro: A. Realistas

Más detalles

RESUMEN DE LA SOLUCIÓN CA ERwin Modeling. Cómo puedo gestionar la complejidad de los datos y mejorar la agilidad empresarial?

RESUMEN DE LA SOLUCIÓN CA ERwin Modeling. Cómo puedo gestionar la complejidad de los datos y mejorar la agilidad empresarial? RESUMEN DE LA SOLUCIÓN CA ERwin Modeling Cómo puedo gestionar la complejidad de los datos y mejorar la agilidad empresarial? CA ERwin Modeling ofrece una perspectiva centralizada sobre las definiciones

Más detalles

RESUMEN DE LA SOLUCIÓN UNIFIED DATA PROTECTION

RESUMEN DE LA SOLUCIÓN UNIFIED DATA PROTECTION RESUMEN DE LA SOLUCIÓN UNIFIED DATA PROTECTION arcserve UDP Ante el crecimiento de los datos y los avances tecnológicos, tales como la virtualización, las arquitecturas actuales de protección de datos

Más detalles

Collaborative Lifecycle Management

Collaborative Lifecycle Management Collaborative Lifecycle Management IBM Rational Software Portafolio.. Documentación Técnica... COLLABORATIVE LIFECYCLE MANAGEMENT La solución de IBM Rational para la Gestión del Ciclo de Vida Colaborativo

Más detalles

BOLETÍN DE NOVEDADES Barcelona, junio de 2008

BOLETÍN DE NOVEDADES Barcelona, junio de 2008 BOLETÍN DE NOVEDADES Barcelona, junio de 2008 Introducción El objeto de este documento es presentar y describir brevemente las principales actuaciones en los últimos meses de Carver en algunos de sus clientes,

Más detalles

Las ventajas de cloud computing se hacen cada día más evidentes.

Las ventajas de cloud computing se hacen cada día más evidentes. Resumen ejecutivo Las ventajas de cloud computing se hacen cada día más evidentes. La informática en la nube, o cloud computing, es un tema de gran actualidad y por buenos motivos. Con este tipo de solución,

Más detalles

Tema 1: Implementación del sistema de archivos

Tema 1: Implementación del sistema de archivos Tema 1: Implementación del sistema de archivos 1. Introducción 2. Implementación 3. Estructura del almacenamiento secundario Dpto. Tema Lenguajes 1: Implementación y Sistemas del Informáticos. sistema

Más detalles

Big Data y Supercómputo. Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE)

Big Data y Supercómputo. Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) Big Data y Supercómputo Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) Big Data 2 Hasta qué cantidad de datos podemos procesar en nuestra

Más detalles

Almacenamiento en la nube

Almacenamiento en la nube white paper Almacenamiento en la nube Ventajas y retos. Almacenamiento en la nube: Ventajas y retos 1 En el nuevo ecosistema TI en que se mueven hoy las organizaciones cualquier planificación del almacenamiento

Más detalles

Elaborado por Víctor Cuchillac (papá)

Elaborado por Víctor Cuchillac (papá) PRE - Especialidad Construyendo la Infraestructura Tecnológica del futuro: Cloud Computing, Seguridad y Virtualización Módulo Cloud Computing Private Cloud Tema Servicios en la nube Víctor Cuchillac (papá)

Más detalles

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09 Introducción a los Algoritmos Genéticos Tomás Arredondo Vidal 17/4/09 Esta charla trata de lo siguiente: Introducción a algunos aspectos de los algoritmos genéticos. Introducción a algunas aplicaciones

Más detalles

Modelo de aplicaciones CUDA

Modelo de aplicaciones CUDA Modelo de aplicaciones CUDA Utilización de GPGPUs: las placas gráficas se utilizan en el contexto de una CPU: host (CPU) + uno o varios device o GPUs Procesadores masivamente paralelos equipados con muchas

Más detalles

IV. Implantación del sistema.

IV. Implantación del sistema. IV. Implantación del sistema. Para hablar sobre el proceso de desarrollo del sistema de Recuperación de Información Visual propuesto, empezaremos hablando del hardware utilizado, las herramientas de software

Más detalles

Formatos para prácticas de laboratorio

Formatos para prácticas de laboratorio Fecha de efectividad: 2014-2 CARRERA L.S.C. PLAN DE CLAVE ESTUDIO ASIGNATURA NOMBRE DE LA ASIGNATURA 2009-2 12001 Administración de Base de Datos. PRÁCTICA LABORATORIO Licenciado en Sistemas DURACIÓN No.

Más detalles

CREACIÓN Y OPERABILIDAD DE UNA BASE DE DATOS DE ADN DISTRIBUIDA MEDIANTE EL USO DE UN SISTEMA GRID CREACIÓN DE ÁRBOLES DE SUFIJOS

CREACIÓN Y OPERABILIDAD DE UNA BASE DE DATOS DE ADN DISTRIBUIDA MEDIANTE EL USO DE UN SISTEMA GRID CREACIÓN DE ÁRBOLES DE SUFIJOS CREACIÓN Y OPERABILIDAD DE UNA BASE DE DATOS DE ADN DISTRIBUIDA MEDIANTE EL USO DE UN SISTEMA GRID CREACIÓN DE ÁRBOLES DE SUFIJOS BÚSQUEDA DE PATRONES HABITUALES COMPRESIÓN DE MOLÉCULAS DE ADN ESTUDIOS

Más detalles

Computación en Red. Máster en Ingeniería de Telecomunicación. 2 º Curso. Curso Académico 2014/15

Computación en Red. Máster en Ingeniería de Telecomunicación. 2 º Curso. Curso Académico 2014/15 Computación en Red Máster en Ingeniería de Telecomunicación Curso Académico 2014/15 2 º Curso GUÍA DOCENTE Nombre de la asignatura: Computación en Red Código: 201816 Titulación en la que se imparte: Carácter:

Más detalles

Alcance y descripción del servicio. Backup Servidor IPLAN. IPLAN iplan.com.ar NSS S.A. Reconquista 865 C1003ABQ Buenos Aires Argentina

Alcance y descripción del servicio. Backup Servidor IPLAN. IPLAN iplan.com.ar NSS S.A. Reconquista 865 C1003ABQ Buenos Aires Argentina Alcance y descripción del servicio Backup Servidor IPLAN 1. Introducción Backup Servidor IPLAN le permite al Cliente realizar resguardos periódicos de la información de su Servidor Virtual y/o Servidor

Más detalles

Cloud Computing. Huibert Aalbers Senior Certified Executive IT Architect

Cloud Computing. Huibert Aalbers Senior Certified Executive IT Architect Cloud Computing Huibert Aalbers Senior Certified Executive IT Architect Cloud Computing Orígenes y Visión Soluciones actuales Grid interno Soluciones de infraestructura App engines Utility Computing Este

Más detalles