Mr-Cirrus: Implementación de Map-Reduce bajo MPI para la ejecución paralela de programas secuenciales

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Mr-Cirrus: Implementación de Map-Reduce bajo MPI para la ejecución paralela de programas secuenciales"

Transcripción

1 Mr-Cirrus: Implementación de Map-Reduce bajo MPI para la ejecución paralela de programas secuenciales Daniel Ramet 1, Juan Lago 2, Johan Karlsson 1, Juan Falgueras 3 y Oswaldo Trelles 1 Resumen Este documento presenta la aplicación Mr-Cirrus (Map-Reduce High Level Clouds) que permite la ejecución de programas secuenciales, sin ninguna modificación interna, trabajando en colaboración para producir un resultado coordinado en entornos de red, computación en nube (cloud computing) y multiprocesadores. El marco de desarrollo se basa en el paradigma Map- Reduce y ha sido implementada bajo MPI. De esta forma, muchas aplicaciones bioinformáticas (sobre las 200 actualmente incluyendo Dotplots, comparación de secuencias, PAML, Muscle, MAFFT, MrBayes y BLAST) pueden escalarse a través de su ejecución paralela, sin necesidad de instalaciones específicas o de alto coste, ni necesidad de conocimientos de programación en entornos multiprocesador. Se han realizado pruebas intensivas en diferentes tipos de procesos con diferentes cargas computaciones y patrones computacionales, con resultados satisfactorios. Palabras clave MapReduce, Cloud Computing, MPI, bioinformática, escalabilidad. encargadas de procesar los datos moleculares son estrictamente regulares, pero cuyo problema actual es el manejo de los nuevos volúmenes de datos y que por lo tanto se adaptan perfectamente a una ejecución paralela. Así, por ejemplo, la ejecución de una búsqueda por semejanza entre una secuencia problema y una colección de secuencias escala linealmente con el número de secuencias en la base de datos, sin ninguna dependencia de datos con respecto al orden de comparación ni a la completitud de los datos a comparar en el caso de repartir el proceso en varios subprocesos que produzcan resultados parciales. La tercera razón viene motivada por el éxito del paradigma Map-Reduce [10] en entornos de computación de alto rendimiento. Su facilidad de uso matiza de forma efectiva la falta de programadores especializados en construir software de alto rendimiento. Se estima que menos del 1% de los desarrolladores de software a nivel mundial están entrenados en computación paralela, y dar el salto a ella no es en absoluto trivial. L I. INTRODUCCIÓN A computación en la nube o cloud computing [1] ha reinventado el tradicional Centro de Datos (data center) para la prestación de servicios computacionales, con una rápida introducción y aceptación en distintos sectores y ámbitos de actividad [2]. Esto es así en gran medida porque la computación en la Cloud promete, y en muchas situaciones lo consigue, recortes en los costes operativos y de capital en la gestión de los recursos computacionales de las instituciones por el ahorro en la adquisición de la infraestructura a cambio de alquilar un recurso de pago-a-demanda según consumo de los recursos (computación, almacenamiento, ancho de banda, etc) y evitando la gestión de las tareas de mantenimiento y puesta a punto del centro de datos. Hay proveedores de servicios en Cloud (como por ejemplo Google App Engine [3], Microsoft Azure [4], IBM Smart Cloud [5] y Amazon EC2 [6]) que ofrecen cantidades importantes de CPU y almacenamiento bajo un software de gestión robusto y sobre cuyas plataformas es relativamente simple instalar una infraestructura en cuestión de minutos [7]. Por otra parte, el espectacular incremento en la producción de datos moleculares (del orden de los Tera y Petabytes) [8,9] y la necesidad de analizar múltiples hipótesis bajo diversos escenarios hace que el análisis de datos genómicos en la biología actual requiera de una potencia computacional que debe ser buscada en la computación paralela. También debemos tener presente que una buena parte de las aplicaciones bioinformáticas 1. Dpto. de Arquitectura de Computadores, Universidad de Málaga. dramet, tjkarlsson, 2. Dpto. de Innovación y Tecnología, Fundación IAVANTE. 3. Dpto. de Lenguajes y Ciencias de la Computación, Universidad de Málaga. En este contexto, el objetivo principal de este trabajo es proporcionar un marco de ejecución de aplicaciones secuenciales, con la premisa de no modificarlas en absoluto, en varias instancias paralelas. El esquema se basa en un gestor de la ejecución que hace a la vez de lanzador de instancias, y dos programas externos para asignar la carga sobre las instancias (map); y para recolectar los resultados parciales y producir un resultado integrado final (reduce). En ambos casos se trata de programas relativamente simples y que no demandan habilidades de programación paralela. Para validar y evaluar el sistema se han elegido dos aplicaciones representativas en el área de la bioinformática; una con un gran número de tareas independientes de pequeños volúmenes de datos (búsquedas por semejanza) y la otra con una sola tarea pero un gran volumen de datos (matrices de puntos). Estas aplicaciones presentan muchas de las características de los procesos actuales en genómica; elevada E-S, gran consumo de memoria y demanda de CPU. Su evaluación nos proporciona información importante para portar al entorno un gran conjunto de aplicaciones con estructura computacional similar. II. MÉTODOS Y SISTEMAS A. El gestor de instancias El diseño del esquema de gestión de la ejecución paralela de programas secuenciales se ha representado en la figura 1. Un proceso maestro es el encargado de la creación de las instancias (servidores) que a su vez

2 invocan al proceso secuencial de acuerdo a las especificación que el maestro ha leído del fichero de mapeo. Los procesos secuenciales ejecutan trabajos parciales e informan de su finalización al servidor quien maneja sus comunicaciones con el maestro, y quien a la finalización de todos los procesos servidores invoca el proceso de reducción o recolección de resultados parciales. Una secuencia genómica S n es una cadena de símbolos {x 1, x 2,..., x n } que pertenecen al alfabeto del ADN (x i A {A, C, G, T}). La matriz de puntos es uno de los métodos más antiguos de comparación de secuencias moleculares [11]. En términos simples, se trata de una representación visual del parecido entre dos secuencias. Una se dispone en horizontal y la otra en vertical y la matriz de puntos se construye comparando cada símbolo de ambas secuencias, ubicando un punto en la celda de intersección de coordenadas cuando los elementos son iguales. De esta forma, las regiones de las secuencias que comparten un parecido sustancial aparecerán como fragmentos diagonales en la matriz. El método estándar para reducir el ruido de los parecidos aleatorios de pequeños fragmentos utiliza una ventana deslizante de un determinado tamaño, de forma que solo resulte en un punto los fragmentos en la ventana cuyo parecido supere un umbral prefijado. Hay muchas y antiguas extensiones a esta metodología básica, que incluyen la fijación interactiva del umbral [12], [13], filtros estadísticos y el uso de diversos símbolos para discriminar las señales [14], el uso de colores para representar la información [15], y se ha extendido la capacidad interactiva [16, 17], incluyendo aplicaciones Web [11], con las típicas capacidades de navegación. Fig. 1. En la parte superior se esquematiza el proceso de asignación o distribución de la carga (map) y la generación de los scripts de ejecución. Un proceso maestro con los respectivos servidores, en el centro, se encargan de realizar las tareas parciales; para finalmente en un proceso de reducción producir el resultado integrado final (reduce). Tanto los procesos de distribución de recursos como los de colección de resultados se especifican a través de ficheros que pueden ser producidos automáticamente por pequeños y simples programas de distribucióncolección de la carga. Estos son los únicos programas que necesitan ser escritos para completar el sistema y muchas veces corresponden a conjuntos o lotes de comandos del sistema operativo. El proceso maestro está preparado para ser tolerante a los fallos de procesos, redistribuyendo la carga no resuelta y para lanzar la totalidad de las instancias por partes o etapas de acuerdo a los recursos disponibles. Ello permite el diseño con distribuciones de carga de tamaño variable a fin de reducir el coste de planificación, y mejorar la sincronización final de los procesos para tareas de baja regularidad. B. Las aplicaciones a implementar 1) Las matrices de puntos Estas referencias nos permiten analizar algunos aspectos computacionales. Estrictamente hablando, la propuesta inicial que realiza la comparación a nivel de símbolo, no requiere las secuencias ni la matriz de puntos en memoria. Bastaría con tener una de las secuencias o parte de ella en memoria e ir trabajando un símbolo a la vez de la segunda secuencia, para mostrar en una pantalla un punto o no. Sin embargo, ya el uso de la ventana deslizante requiere al menos parte de la segunda secuencia en memoria. Finalmente, la interactividad sobre la matriz de resultados requiere que las aplicaciones gestionen la matriz de puntos en memoria. Esto era posible porque se trabajaba sobre las secuencias relativamente pequeñas que se disponían (genes o genomas de pequeños virus de algunos pocos KB). Sin embargo, hoy en día se dispone de información de genomas completos de organismos superiores, entre ellos el humano, con algunos GB de símbolos (el genoma humano sobrepasa los 3 GB y sus cromosomas son de algunos cientos de MB). Aún por separado, tanto el cálculo como la visualización de la matriz de puntos representan grandes retos computacionales. Por ejemplo, la comparación de dos genomas medios de bacterias de 3 Mb, en un equipo capaz de comparar 100 MB, usando una ventana de un solo símbolo necesitaría alrededor de 25 horas, [16]. Cada incremento de una unidad en el tamaño de la ventana representaría un día más de tiempo de computación. Por otra parte, las aplicaciones de análisis interactivo requieren la matriz en memoria. En [18] propusimos gestionar la matriz a distintos niveles de resolución llegando a manejar matrices con algunos, notables para su momento, cientos de KB de longitud. Más adelante, en [15] se

3 presenta una aplicación para visualizar grandes alineamientos y en [19], se hizo en Web. 2) Comparación de secuencias biológicas La comparación de secuencias biológicas es posiblemente la aplicación de mayor uso en bioinformática. En esencia, dada una secuencia problema y una colección de secuencias conocidas, se trata de identificar aquellas secuencias en la colección que más se parezcan a la secuencia problema. De estas relaciones se pueden inferir relaciones evolutivas, estructurales o funcionales entre las secuencias. En términos más formales, dada una secuencia S Q y un conjunto de secuencias D = {S 1, S 2,..., S n } se debe comparar S Q contra cada una de las secuencias del conjunto D a fin de identificar aquellas S i, i {1 n}. III. RESULTADOS A. Los procesos de distribución y reducción Los procesos de asignación de carga a procesos (Map) y colección de resultados (Reduce) se han diseñado para que puedan ser preparados de forma externa tanto a la aplicación secuencial como al gestor de la ejecución. En el primer caso de estudio, la matriz de puntos se construye para dos secuencias S x y S y, por lo que la distribución de carga más simple es la de repartir el espacio computacional L x L y, donde L x y L y son las longitudes de las secuencias respectivas. Para ello, se parte cada una de las secuencias en N x y N y trozos para luego invocar el programa para cada combinación S i y S j i=1... N x ; y j=1...n y ), lo que producirá resultados parciales RES(i,j) que serán unidos por un proceso de Reducción para producir la super-matriz final. Es interesante indicar que este proceso genera además los scripts que permiten lanzar directamente las instancias (incluso en una máquina monoprocesadora). que las tareas que involucren a las secuencias largas gobernarán la eficiencia del sistema. Por ello, la distribución de la base de datos (conjunto conocido de secuencias) no solo es importante, sino que debe realizarse de forma que minimice la latencia de inicio (con mínimo de lanzamiento de instancias) y facilite la sincronización de finalización mediante, en ambos casos, de las tareas livianas al inicio y final del procesamiento en paralelo. El coste de planificación está asociado al número de tareas a distribuir (en nuestro caso especialmente por la latencia de lanzar una nueva instancia) y al tamaño de las últimas tareas a distribuir. La planificación guiada (Guided Self Scheduling) se planteó este problema. Dado un número n de instancias a crear en paralelo, la mejor solución en la que permite a todas las instancias finalizar con una diferencia máxima de B unidades de tiempo, siendo B el tiempo necesario para realizar un bloque básico de tareas. El razonamiento es el de asignar en la i-ésima distribución x i bloques, dejando suficientes bloques para distribuir a los n-1 instancias. Para conseguirlo, sea N el número de bloques de tareas, entonces x i queda definido por: x i = R i / n R i+1 = R i - x i donde R 1 = N Nosotros propusimos una modificación de esta distribución bajo la observación de que las tareas grandes que se generan en las primera iteraciones (ver tabla 1) produce una gran latencia tanto por el lanzamiento de la instancia pero especialmente por la llegada de los datos, llegando a producir incluso TABLA 1 TAMAÑOS DE LOS BLOQUES A DISTRIBUIR USANDO GSS Y NUESTRO GSS MODIFICADO (GSS-MOD) PARA N=100 Y 4 PROCESADORES. El segundo caso, búsquedas de secuencias por semejanza, presenta dos variantes. Una primera se presenta cuando se dispone de varias secuencias S Q (Q=1...N) y por tanto la primera distribución es la de repartir cada una de las secuencias a cada proceso. En el segundo caso se trata de procesar una sola secuencia S Q que se compara contra todas las secuencias del conjunto, por lo que en este caso lo natural es distribuir la colección de secuencias. Se debe observar que ambas soluciones pueden a su vez combinarse para formar una tercera opción que consistiría en separar secuencias y distribuir también el conjunto de secuencias conocidas. Es importante destacar que la primera variante puede presentar serios problemas de eficiencia cuando el número de secuencias problema (S Q ) es muy pequeño, y cuando las diferencias de longitud de las secuencias en dicho conjunto sean significativas, lo que supone

4 inanición en las últimas instancias (este hecho fue confirmado en los experimentos del trabajo de Google [10]). Estas modificaciones se traducen en los siguiente cálculos: x i = R i / n x -i+1 = x i R i+1 = R i - x i siendo R 1 = N / 2 B. Evaluación Para evaluar la solución propuesta hemos utilizado el cluster de la Red Española de Supercomputación, ubicado en el Centro de Bioinnovación de la Universidad de Málaga. Este cluster de memoria distribuida de la marca IBM está compuesto por 256 nodos JS20-IBM, cada nodo con 2 CPU IBM PowerPC single-core 970FX de 64bits a 2GHz, y 1 TB de memoria distribuida. La programación se ha realizado en C, usando la librería de paso de mensajes MPI. Para las primeras pruebas realizadas sobre la aplicación de matrices de puntos, se han usado dos secuencias de aproximadamente 1 MB de longitud, de las cepas APS y BPS de la bacteria Buchnera aphidicola (el primer genoma eucariota secuenciado en España); y también variaciones en tamaño de estas secuencias para observar el comportamiento con referencia al espacio computacional a distribuir. Para la segunda aplicación se ha seleccionado un conjunto de secuencias de la base de datos swissprot (80 mil secuencias) y se han seleccionado de ella 100 secuencias que serán usadas como conjunto problema (estas secuencias fueron a su vez eliminadas del conjunto conocido de secuencias). En cada una de las pruebas se han utilizado diferente número de instancias de los procesos a fin de evaluar la escalabilidad. La tabla 2 muestra los resultados de las pruebas donde se puede apreciar que se han utilizado distintos tamaños para validar la eficacia de la propuesta ante diferentes tamaños de carga. Fig. 2. Composición de los resultados parciales del proceso de la matriz de puntos, utilizando para ello dos secuencias de 2 y 3KB de longitud con diferente particionado. matrices parciales que conforman la matriz de punto de dos secuencias, obtenidas por seis procesos diferentes. Finalmente en la figura 3 se muestran los tiempos y la gráfica de aceleración correspondientes para los tests realizados. Para la aplicación de las Matrices de Puntos, se han usado los genomas de las bacterias Buchnera TABLA 2 DETALLES DE LOS CONJUNTOS DE PRUEBA. TAMAÑO DE LAS SECUENCIAS EN LOS DOTPLOTS Y DE LOS CONJUNTOS PROBLEMA EN LAS BÚSQUEDAS POR SEMEJANZA. ACELERACIÓN 2 PE 4 PE 8 PE 16 PE 32 PE 64 PE Óptima 2,00 4,00 8,00 16,00 32,00 64,00 Dotplot Buchnera 2,00 3,87 7,58 14,17 25,13 53,06 Frag. E.Coli y B.Subtilis 1,96 3,80 7,84 15,84 31,04 61,44 Fragmentos Buchnera 1,95 3,78 8,00 16,00 31,68 59,58 Blast singletons 1,98 3,96 7,88 15,74 30,86 56,66 Los programas se han comprobado a fin de confirmar que reproducen los resultados originales como se muestra en la figura 2, en la que se muestran las seis Fig.3. Resultados de aceleración en las implementaciones propuestas, en las que se observa un comportamiento cercano al ideal tanto para el proceso de la matriz de puntos, para la obtención de todos los fragmentos mayores que una longitud mínima (a partir de ahora, Fragmentos), y para el Blast en ejecuciones de casos reales. Para el caso de los Dotplots y Fragmentos, estos resultados corresponden a las secuencias Buchnera APS y BPS (600 KB), mientras que para Blast se han utilizado un conjunto de contigs y singletons que hacen las veces de secuencias problema. Para conjuntos de datos mayores, los resultados son incluso mejores, demostrando la escalabilidad de la solución, tal y como se puede ver en la ejecución de Fragmentos para las bacterias E. Coli (4,5 MB) y B. Subtilis (4,1 MB). Para datos de tiempos, ver la tabla 3.

5 TABLA 3 DETALLES DE LOS DATOS DE TIEMPO ASOCIADOS A LAS IMPLEMENTACIONES PROPUESTAS (CONTINUACIÓN FIGURA 3). Dotplot Buchnera TIEMPO 2 PE 4 PE 8 PE 16 PE 32 PE 64 PE Óptimo 03:21:48 01:40:54 00:50:27 00:25:14 00:12:37 00:06:19 Map-Reduce 03:19:47 01:44:17 00:53:07 00:30:00 00:15:20 00:07:24 Fragmentos E. Coli y B. Óptimo 50:40:00 25:20:00 12:40:00 06:20:00 03:10:00 01:35:00 Subtilis Map-Reduce 51:40:00 26:40:00 12:49:25 06:21:40 03:14:50 01:38:00 Fragmentos Buchnera Blast singletons Óptimo 01:05:00 00:32:30 00:16:15 00:08:08 00:04:04 00:02:02 Map-Reduce 01:06:37 00:34:17 00:16:15 00:08:08 00:04:06 00:02:10 Óptimo 00:58:10 00:29:05 00:14:33 00:07:17 00:03:39 00:01:50 Map-Reduce 00:58:37 00:29:21 00:14:46 00:07:24 00:03:47 00:02:02 APS y BPS de algo más de 600 KB de longitud; mientras que en las Comparaciones por Semejanza, se han utilizado secuencias (singletons procedentes de un proceso de ensamblaje) que son contrastadas contra grupos (contigs) de secuencias. También se han realizado pruebas con una carga de datos mayor como son las bacterias E. Coli y B. Subtilis de más de 4 MB de longitud mediante la comparación por semejanza. Los resultados indican que estas implementaciones escalan linealmente con el número de procesadores con aceleraciones cercanas a la máxima. Se ha probado el rendimiento para volúmenes de datos o carga computacional menor, y como cabría esperar, cuando el número de procesadores crece, la carga por proceso no es suficiente para compensar la latencia de inicio de los procesos y, por tanto, el número de procesadores debe fijarse en función de la carga para alcanzar buenos rendimientos. IV. CONCLUSIONES La computación en la Cloud abre nuevas oportunidades para acercar la computación de alto rendimiento a laboratorios que requieren procesar grandes cantidades de datos pero que no disponen de infraestructura computacional adecuada. Por otra parte, la bioinformática ha despegado como una línea de investigación en la que el desarrollo de software tiene que lidiar con el problema de los grandes conjuntos de datos. Existe una gran diversidad de aplicaciones en este campo, pero en su práctica totalidad están preparadas para una ejecución secuencial y unas condiciones que ya han dejado de estar presentes. Este documento se centra en el desarrollo de un marco de trabajo que permita la reutilización de estas aplicaciones en entornos paralelos, exigiendo que no se toque el código secuencial ya que muchas de ellas son aplicaciones bastante antiguas aunque válidas (legacy applications). El desarrollo es en idea sencillo, aunque requiere una programación eficiente y cuidadosa para manejar situaciones de conflicto, como es el fallo de procesos, su sincronización, y el balanceo de la carga. Los mayores problemas encontrados, como era de esperar, han sido en el ámbito de la E-S. Para el caso de redes de ordenadores, siempre es posible utilizar los discos locales para evitar el cuello de botella en el sistema de almacenamiento al concurrir a él cientos y potencialmente miles de procesos. Cuando no se dispone de este sistema distribuido de almacenamiento, el cuello de botella impide escalar bien a la aplicación. Por ello en algunos casos es necesario abordar tanto la reformulación como el diseño de nuevo software. También es cierto que el sistema es válido para aplicaciones que deben llevar adelante una serie de tareas más o menos homogéneas y que procesos de una sola tarea y con grandes dependencias de datos, son en principio difíciles de adecuar a este entorno. Sin embargo, una estimación realizada en nuestro grupo, calcula que no más del 20% de los programas bioinformáticos tienen este diseño, por lo que la aproximación sigue siendo válida para el gran porcentaje de aplicaciones bioinformáticas. Aunque las aplicaciones presentadas en este documento tienen un patrón de cálculo bastante regular (en el caso de los dotplots se ha usado un código de fuerza bruta) la introducción de heterogeneidad en las tareas (que no la de interdependencias) es aún manejable vía el uso de una distribución de carga más inteligente (guiada, por ejemplo) con resultados satisfactorios. Por tanto, no hay dependencia con la optimización de los cálculos que puedan introducir nuevas versiones de los algoritmos. Finalmente, el desarrollo de este entorno de trabajo permitirá llevar a una ejecución paralela a cientos de programas en el ámbito bioinformático, abriendo nuevas oportunidades para el análisis de datos y para la ciencia en general. AGRADECIMIENTOS Este trabajo ha sido parcialmente financiado por el Instituto Nacional de Bioinformática, plataforma del Instituto de Salud Carlos III; la Acción Integrada del Programa Nacional de Internacionalización de la I+D; Subprograma: Acciones Integradas 2009; Ministerio de Ciencia e Innovación. Referencia AT y el programa Virtual Multidisciplinary EnviroNments USing Cloud Infrastructures, FP7-VENUS-C (www.venus-c.eu). REFERENCIAS [1] Armbrust M, Fox, et al. Above the Clouds: A Berkeley View of Cloud Computing. Technical report

6 [http://www.eecs.berkeley.edu/pubs/techrpts/2009/eecs pdf]. [2] Press Release: Gartner s 2009 Hype Cycle Special Report Evaluates Maturity of 1,650 Technologies. [http://www.gartner.com/it/page.jsp?id= ]. [3] Google App.Engine: Welcome to the Google Apps; [4] What is the Windows Azure platform?; [5] IBM smart Cloud: [6] Amazon Elastic Compute Cloud: [7] Amazon. Build a Cluster Computing Environment in under 10 minutes. 10/ [8] Editorial, Big data: Welcome to the petacentre, Nature 455, (2008) doi: /455016a [9] 1000 Genomes: A Deep Catalog of Human Genetic Variation (http://www.1000genomes.org). [10] Dean, J. and Ghemawat, S. MapReduce: simplified data processing on large clusters. "Comm. ACM", 51, ), [11 Gibbs, A.J. and McIntyre, G.A. The Diagram, a Method for Comparing Sequences, Its Use with Amino Acid and Nucleotide Sequences. European J. Biochemistry, vol. 16, pp. 1-11, [12] Maizel, J.V. and Lenk, R.P. Enhanced Graphic Matrix Analysis of Nucleic Acid and Protein Sequences. Proceedings of the National Academy of Science, USA 78, 12, [13] Staden, R. An interactive graphics program for comparing and aligning nucleic acid and amino acid sequences, Nucleic Acids Research, 1982, Vol. 10, No [14] Pustell and Kafatos, 1984J. Pustell and F.C. Kafatos, A convenient and adaptable package of computer programs for DNA and protein sequence management, analysis and homology determination, Nucl. Acids Res. 12 (1984), pp [15] Reisner, H and Bucholtz. The use of various properties of amino acids in color and monochrome dot-matrix analyses for protein homologies. Bioinformatics, Volume 4, Number 3Pp [16] Nedde, D.N. and Ward, M.O. Visualizing relationships between nucleic acid sequences using correlation images. CABIOS, 9(3): [17] Trelles-Salazar, O.; Zapata, E.L.; Dopazo, J.; Coulson, A.W.F and Carazo, J.M. An Image processing approach to DotPlots : An X window-based program for interactive analysis of dotplots derived from sequence and structural data, CABIOS (11) 3: [18] Schwartz,S PipMaker- a web server for aligning two genomic DNA sequences. Genome Res., 10, , [19] Trelles-Salazar, O.; Zapata, E.L.; Dopazo, J.; Coulson, A.W.F and J.M.Carazo. An Image processing approach to DotPlots : An X window-based program for interactive analysis of dotplots derived from sequence and structural data, CABIOS (11) 3:

Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la

Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la ejecución de programas secuenciales de forma paralela con el requisito de no modificar los programas secuenciales. La idea fundamental

Más detalles

PCI 2010 Acción Preparatoria. Computación Avanzada en Aplicaciones Biomédicas. (High Performance Computing applied to Life Sciences)

PCI 2010 Acción Preparatoria. Computación Avanzada en Aplicaciones Biomédicas. (High Performance Computing applied to Life Sciences) PCI 2010 Acción Preparatoria Computación Avanzada en Aplicaciones Biomédicas CaaB (High Performance Computing applied to Life Sciences) Descripción general Participantes Universidad de Málaga, España CIEMAT,

Más detalles

CURSOS DE VERANO 2014

CURSOS DE VERANO 2014 CURSOS DE VERANO 2014 CLOUD COMPUTING: LA INFORMÁTICA COMO SERVICIO EN INTERNET LA PLATAFORMA GOOGLE CLOUD PLATFORM. GOOGLE APP ENGINE Pedro A. Castillo Valdivieso Universidad de Granada http://bit.ly/unia2014

Más detalles

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Big Data: retos a nivel de desarrollo Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Cámara de Comercio de Bogotá Centro Empresarial Chapinero Agenda Introducción Bases de datos NoSQL Procesamiento

Más detalles

CURSOS DE VERANO 2014

CURSOS DE VERANO 2014 CURSOS DE VERANO 2014 CLOUD COMPUTING: LA INFORMÁTICA COMO SERVICIO EN INTERNET La plataforma Google Cloud Platform. Google App Engine Pedro A. Castillo Valdivieso Universidad de Granada La plataforma

Más detalles

GPU IMPLEMENTATIONS OF SCHEDULING HEURISTICS FOR HETEROGENEOUS COMPUTING ENVIRONMENTS

GPU IMPLEMENTATIONS OF SCHEDULING HEURISTICS FOR HETEROGENEOUS COMPUTING ENVIRONMENTS GPU IMPLEMENTATIONS OF SCHEDULING HEURISTICS FOR HETEROGENEOUS COMPUTING ENVIRONMENTS MAURO CANABÉ SERGIO NESMACHNOW Centro de Cálculo, Facultad de Ingeniería Universidad de la República, Uruguay GPU IMPLEMENTATIONS

Más detalles

CLOUD AND SKY COMPUTING

CLOUD AND SKY COMPUTING Universidad Simón Bolívar Sistemas de Operación III (CI-4822) Septiembre Diciembre 2013 CLOUD AND SKY COMPUTING Carlos Gómez Pedro Romero TEMAS Cloud Computing Historia Concepto Características Arquitectura

Más detalles

PROYECTO REALIZADO POR: ENTIDAD GESTORA: COFINANCIADO POR:

PROYECTO REALIZADO POR: ENTIDAD GESTORA: COFINANCIADO POR: CLOUD COMPUTING PROYECTO REALIZADO POR: ENTIDAD GESTORA: COFINANCIADO POR: 1. Introducción 1. Qué es el Cloud Computing? La computación en nube es un sistema informático basado en Internet y centros de

Más detalles

CENTRO DE RESGUARDO ARQUITECTURA AVANZADA PROF.: JUAN JOSÉ MUÑOZ BUSSI AUTOR: MARIANA FERRETTO

CENTRO DE RESGUARDO ARQUITECTURA AVANZADA PROF.: JUAN JOSÉ MUÑOZ BUSSI AUTOR: MARIANA FERRETTO CENTRO DE RESGUARDO ARQUITECTURA AVANZADA PROF.: JUAN JOSÉ MUÑOZ BUSSI AUTOR: MARIANA FERRETTO CENTRO DE RESGUARDO Centro de Cómputos de Resguardo Sitio para reubicarse luego de un desastre Sitio manejado

Más detalles

Tema 1: Implementación del sistema de archivos

Tema 1: Implementación del sistema de archivos Tema 1: Implementación del sistema de archivos 1. Introducción 2. Implementación 3. Estructura del almacenamiento secundario Dpto. Tema Lenguajes 1: Implementación y Sistemas del Informáticos. sistema

Más detalles

Módulo: Modelos de programación para Big Data

Módulo: Modelos de programación para Big Data Program. paralela/distribuida Módulo: Modelos de programación para Big Data (título original: Entornos de programación paralela basados en modelos/paradigmas) Fernando Pérez Costoya Introducción Big Data

Más detalles

Programación híbrida en arquitecturas cluster de multicore. Escalabilidad y comparación con memoria compartida y pasaje de mensajes.

Programación híbrida en arquitecturas cluster de multicore. Escalabilidad y comparación con memoria compartida y pasaje de mensajes. Programación híbrida en arquitecturas cluster de multicore. Escalabilidad y comparación con memoria compartida y pasaje de mensajes. Fabiana Leibovich, Armando De Giusti, Marcelo Naiouf, Laura De Giusti,

Más detalles

Diseño del Sistema de Información

Diseño del Sistema de Información Diseño del Sistema de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS...2 ACTIVIDAD DSI 1: DEFINICIÓN DE LA ARQUITECTURA DEL SISTEMA...7 Tarea DSI 1.1: Definición de Niveles de Arquitectura...9 Tarea DSI 1.2:

Más detalles

Diseño del Sistema de Información

Diseño del Sistema de Información Diseño del Sistema de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 2 ACTIVIDAD DSI 1: DEFINICIÓN DE LA ARQUITECTURA DEL SISTEMA... 7 Tarea DSI 1.1: Definición de Niveles de Arquitectura... 9 Tarea DSI

Más detalles

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928 Alessandro Chacón 05-38019 Ernesto Level 05-38402 Ricardo Santana 05-38928 CONTENIDO Universo Digital Hadoop HDFS: Hadoop Distributed File System MapReduce UNIVERSO DIGITAL 161 EB 2006 Fuente: International

Más detalles

2 Congreso Colombiano de Bioinformática y biología computacional.

2 Congreso Colombiano de Bioinformática y biología computacional. 2 Congreso Colombiano de Bioinformática y biología computacional. Presentación y evaluación de ABMS (Automatic Blast for Massive Annotation) Nelson Perez nelsonp@correo.udistrital.edu.co Cristian Rojas

Más detalles

BIG DATA. Jorge Mercado. Software Quality Engineer

BIG DATA. Jorge Mercado. Software Quality Engineer BIG DATA Jorge Mercado Software Quality Engineer Agenda Big Data - Introducción Big Data - Estructura Big Data - Soluciones Conclusiones Q&A Big Data - Introducción Que es Big Data? Big data es el termino

Más detalles

Cloud Computing. Rodrigo Moreno Rosales DN-11

Cloud Computing. Rodrigo Moreno Rosales DN-11 Cloud Computing Rodrigo Moreno Rosales DN-11 Cloud Computing La computación en la nube,conocido también como servicios en la nube, informática en la nube, nube de cómputo o nube de conceptos, es un paradigma

Más detalles

La filosofía open source en la bioinformática

La filosofía open source en la bioinformática 03-09-2009 La filosofía open source en la bioinformática Desde hace una década el fenómeno open source o código abierto ha explotado y sus efectos se pueden ver en todas partes y también en la ciencia.

Más detalles

Comprender la relación entre data-intensive applications y cloud computing, y

Comprender la relación entre data-intensive applications y cloud computing, y Sociedad Peruana de Computación Facultad de Computación Programa Profesional de (Ciencia de la Computación) (V2.0) SILABO CS331. Cloud Computing (Obligatorio) 2010-1 1. DATOS GENERALES 1.1 CARRERA PROFESIONAL

Más detalles

Linux Week PUCP. Computación de Alto Rendimiento en Linux. rmiguel@senamhi.gob.pe

Linux Week PUCP. Computación de Alto Rendimiento en Linux. rmiguel@senamhi.gob.pe Linux Week PUCP 2006 Computación de Alto Rendimiento en Linux Richard Miguel San Martín rmiguel@senamhi.gob.pe Agenda Computación Científica Computación Paralela High Performance Computing Grid Computing

Más detalles

III. INTRODUCCIÓN AL CLOUD COMPUTING

III. INTRODUCCIÓN AL CLOUD COMPUTING III. INTRODUCCIÓN AL CLOUD COMPUTING Definición (I) Qué es el cloud computing? Nuevo paradigma de computación distribuida Provee un servicio de acceso a recursos computacionales: servidores, almacenamiento,

Más detalles

EMC SCALEIO SAN de servidor convergente definida por software

EMC SCALEIO SAN de servidor convergente definida por software EMC SCALEIO SAN de servidor convergente definida por software ASPECTOS FUNDAMENTALES Solo para software Arquitectura convergente de capa simple Escalabilidad lineal Rendimiento y capacidad según demanda

Más detalles

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

Introducción. Francisco J. Martín Mateos. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Francisco J. Martín Mateos Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Qué es la (KE)? Definición de Wikipedia: La es una disciplina cuyo objetivo es integrar conocimiento

Más detalles

Soluciones para entornos HPC

Soluciones para entornos HPC Dr.. IT Manager / Project Leader @ CETA-Ciemat abelfrancisco.paz@ciemat.es V Jornadas de Supercomputación y Avances en Tecnología INDICE 1 2 3 4 HPC Qué? Cómo?..................... Computación (GPGPU,

Más detalles

SBDA-GRID: implementación de un servicio de base de datos en una arquitectura grid

SBDA-GRID: implementación de un servicio de base de datos en una arquitectura grid SBDA-GRID: implementación de un servicio de base de datos en una arquitectura grid Nancy Ocotitla Rojas, Axel E. Moreno Cervantes, Rogelio Castro González Escuela Superior de Cómputo-IPN, Av. Juan de Dios

Más detalles

Contenido. Sistema de archivos. Operaciones sobre archivos. Métodos de acceso a archivos. Directorio. Sistema de archivos por capas.

Contenido. Sistema de archivos. Operaciones sobre archivos. Métodos de acceso a archivos. Directorio. Sistema de archivos por capas. Contenido Sistema de archivos Operaciones sobre archivos Métodos de acceso a archivos Directorio Sistema de archivos por capas Espacio libre Sistema de archivos Proporciona el mecanismo para el almacenamiento

Más detalles

Dimensions CM frente a ClearCase Comparación de rendimiento

Dimensions CM frente a ClearCase Comparación de rendimiento Resumen de la solución FUNCIONES CLAVE Administración de procesos, cambios, configuraciones, versiones y entregas desde una sola arquitectura Apoyo para desarrollo paralelo de avanzada y fusión a nivel

Más detalles

Indice 1. Introducción a la computación en nube (cloud computing)

Indice 1. Introducción a la computación en nube (cloud computing) Tema 9. Centros de datos: computación en nube y organización física Indice 1. Introducción a la computación en nube (cloud computing) 2. Virtualización de recursos: consolidación de servidores 3. Arquitectura

Más detalles

CLUSTER FING: ARQUITECTURA Y APLICACIONES

CLUSTER FING: ARQUITECTURA Y APLICACIONES CLUSTER FING: ARQUITECTURA Y APLICACIONES SERGIO NESMACHNOW Centro de Cálculo, Instituto de Computación FACULTAD DE INGENIERÍA, UNIVERSIDAD DE LA REPÚBLICA, URUGUAY CONTENIDO Introducción Clusters Cluster

Más detalles

Motores de Búsqueda Web Tarea Tema 2

Motores de Búsqueda Web Tarea Tema 2 Motores de Búsqueda Web Tarea Tema 2 71454586A Motores de Búsqueda Web Máster en Lenguajes y Sistemas Informáticos - Tecnologías del Lenguaje en la Web UNED 30/01/2011 Tarea Tema 2 Enunciado del ejercicio

Más detalles

Bienvenidos a la presentación: Introducción a conceptos básicos de programación.

Bienvenidos a la presentación: Introducción a conceptos básicos de programación. Bienvenidos a la presentación: Introducción a conceptos básicos de programación. 1 Los programas de computadora son una serie de instrucciones que le dicen a una computadora qué hacer exactamente. Los

Más detalles

CENTRO DE DATOS Y POP

CENTRO DE DATOS Y POP Virtual y física. Pública y privada. Por horas o por meses. Nuestra plataforma unificada proporciona infraestructuras en la nube a nivel de Internet. Todo lo que quiera, desplegado bajo demanda y en tiempo

Más detalles

Modelo de aplicaciones CUDA

Modelo de aplicaciones CUDA Modelo de aplicaciones CUDA Utilización de GPGPUs: las placas gráficas se utilizan en el contexto de una CPU: host (CPU) + uno o varios device o GPUs Procesadores masivamente paralelos equipados con muchas

Más detalles

Módulo Profesional 01: Bases de datos (código: 0484).

Módulo Profesional 01: Bases de datos (código: 0484). Módulo Profesional 01: Bases de datos (código: 0484). Actividades de enseñanza-aprendizaje que permiten alcanzar los objetivos del módulo. Interpretar diseños lógicos de bases de datos. Realizar el diseño

Más detalles

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09

Introducción a los Algoritmos Genéticos. Tomás Arredondo Vidal 17/4/09 Introducción a los Algoritmos Genéticos Tomás Arredondo Vidal 17/4/09 Esta charla trata de lo siguiente: Introducción a algunos aspectos de los algoritmos genéticos. Introducción a algunas aplicaciones

Más detalles

Planos de ejecución en Velneo V7

Planos de ejecución en Velneo V7 Planos de ejecución en Velneo V7 Por Jesús Arboleya Introducción 3 Arquitectura Cliente/Servidor 4 1. Objetos que siempre se ejecutan en el servidor 5 2. Objetos que siempre se ejecutan en el cliente 6

Más detalles

Identificación rápida de cuellos de botella: Una mejor manera de realizar pruebas de carga. Documento técnico de Oracle Junio de 2009

Identificación rápida de cuellos de botella: Una mejor manera de realizar pruebas de carga. Documento técnico de Oracle Junio de 2009 Identificación rápida de cuellos de botella: Una mejor manera de realizar pruebas de carga Documento técnico de Oracle Junio de 2009 Identificación rápida de cuellos de botella: Una mejor manera de realizar

Más detalles

Arquitectura de Aplicaciones

Arquitectura de Aplicaciones 1 Capítulo 13: Arquitectura de aplicaciones. - Sommerville Contenidos del capítulo 13.1 Sistemas de procesamiento de datos 13.2 Sistemas de procesamiento de transacciones 13.3 Sistemas de procesamiento

Más detalles

Servicios de infraestructura. Aplicaciones web

Servicios de infraestructura. Aplicaciones web 10 Julio 2013 Servicios de infraestructura Compílela o tráigala y nosotros la ejecutamos Windows Azure proporciona infraestructura a petición que se escala y se adapta a las necesidades cambiantes de cada

Más detalles

MapReduce. Modelo de programación MapReduce. MapReduce. Sistemas Distribuidos. Tecnologías procesado masivo de datos. Vamos a contar palabras

MapReduce. Modelo de programación MapReduce. MapReduce. Sistemas Distribuidos. Tecnologías procesado masivo de datos. Vamos a contar palabras Tecnologías procesado masivo de datos Sistemas Distribuidos Modelo de programación Modelo de programación Alm. lógico Alm. físico Serv. genéricos Pregel... BigTable GFS Serv. genéricos 2 Vamos a contar

Más detalles

Ingeniero en Informática

Ingeniero en Informática UNIVERSIDAD DE ALMERÍA Ingeniero en Informática CLÚSTER DE ALTO RENDIMIENTO EN UN CLOUD: EJEMPLO DE APLICACIÓN EN CRIPTOANÁLISIS DE FUNCIONES HASH Autor Directores ÍNDICE 1. Introducción 2. Elastic Cluster

Más detalles

Análisis de despliegue de una IaaS utilizando Openstack

Análisis de despliegue de una IaaS utilizando Openstack Análisis de despliegue de una IaaS utilizando Openstack Brian Galarza 1, Gonzalo Zaccardi 1, Diego Encinas 1,2, Martín Morales 1 1 Instituto de Ingeniería y Agronomía - Universidad Nacional Arturo Jauretche

Más detalles

[Webcast] Servicios de Cómputo en Azure. Implementación Avanzada de Cómputo en la Nube [Web App, Cloud Service y Virtual Machines]

[Webcast] Servicios de Cómputo en Azure. Implementación Avanzada de Cómputo en la Nube [Web App, Cloud Service y Virtual Machines] [Webcast] Servicios de Cómputo en Azure Implementación Avanzada de Cómputo en la Nube [Web App, Cloud Service y Virtual Machines] [Webcast] Servicios de Cómputo en Azure Implementación Avanzada de Cómputo

Más detalles

WebSphere Extended Deployment

WebSphere Extended Deployment IBM Software Group WebSphere Extended Deployment Gestión de Efectividad y Capacidad Agenda WebSphere Extended Deployment: Introducción Dynamic Operations Extended Manageability High Performance Computing

Más detalles

Intel Tera-Scale Computing Alumno: Roberto Rodriguez Alcala

Intel Tera-Scale Computing Alumno: Roberto Rodriguez Alcala Intel Tera-Scale Computing Alumno: Roberto Rodriguez Alcala 1. Introducción Los procesadores con dos núcleos existen actualmente, y los procesadores de cuatro están insertándose en el mercado lentamente,

Más detalles

Desarrollo de un cluster computacional para la compilación de. algoritmos en paralelo en el Observatorio Astronómico.

Desarrollo de un cluster computacional para la compilación de. algoritmos en paralelo en el Observatorio Astronómico. Desarrollo de un cluster computacional para la compilación de algoritmos en paralelo en el Observatorio Astronómico. John Jairo Parra Pérez Resumen Este artículo muestra cómo funciona la supercomputación

Más detalles

MS_20247 Configuring and Deploying a Private Cloud

MS_20247 Configuring and Deploying a Private Cloud Gold Learning Gold Business Intelligence Silver Data Plataform Configuring and Deploying a Private Cloud www.ked.com.mx Por favor no imprimas este documento si no es necesario. Introducción. Este curso

Más detalles

Plataformas Tecnológicas y Requerimientos Técnicos de las Aplicaciones de

Plataformas Tecnológicas y Requerimientos Técnicos de las Aplicaciones de Plataformas Tecnológicas y Requerimientos Técnicos de las Aplicaciones de Departamento de Sistemas 2014 Página 1 INDICE Introducción 3 Requisitos Generales del Entorno 3 Requisitos Generales de las Aplicaciones

Más detalles

Una potencia informática excepcional. Prestación de almacenamiento extraordinaria. Flexibilidad de red definitiva. Experiencia integrada o compilada

Una potencia informática excepcional. Prestación de almacenamiento extraordinaria. Flexibilidad de red definitiva. Experiencia integrada o compilada Una potencia informática excepcional. Prestación de almacenamiento extraordinaria. Flexibilidad de red definitiva. Experiencia integrada o compilada a medida. Infraestructura de servidor preconfigurada

Más detalles

Arquitecturas de computadoras

Arquitecturas de computadoras Arquitecturas de computadoras Colaboratorio Nacional de Computación Avanzada (CNCA) 2014 Contenidos 1 Computadoras 2 Estación de Trabajo 3 Servidor 4 Cluster 5 Malla 6 Nube 7 Conclusiones Computadoras

Más detalles

DESKTOP GRID Y COMPUTACIÓN VOLUNTARIA: INTRODUCCIÓN A LA TECNOLOGÍA BOINC

DESKTOP GRID Y COMPUTACIÓN VOLUNTARIA: INTRODUCCIÓN A LA TECNOLOGÍA BOINC DESKTOP GRID Y COMPUTACIÓN VOLUNTARIA: INTRODUCCIÓN A LA TECNOLOGÍA BOINC José Luis Guisado Lizar http://cum.unex.es/profes/profes/jlguisado Grupo de Evolución Artificial (GEA) Universidad de Extremadura

Más detalles

Collaborative Lifecycle Management

Collaborative Lifecycle Management Collaborative Lifecycle Management IBM Rational Software Portafolio.. Documentación Técnica... COLLABORATIVE LIFECYCLE MANAGEMENT La solución de IBM Rational para la Gestión del Ciclo de Vida Colaborativo

Más detalles

Innovación para su Contact Center. Business Rules. Personalice al máximo la experiencia del cliente, aplicando reglas de negocio

Innovación para su Contact Center. Business Rules. Personalice al máximo la experiencia del cliente, aplicando reglas de negocio Innovación para su Contact Center Business Rules Personalice al máximo la experiencia del cliente, aplicando reglas de negocio ÍNDICE DATA SHEET 1. Introducción... 4 2. Características principales... 4

Más detalles

Metodología y Framework para el Desarrollo de Aplicaciones Científicas con Computación de Alto Rendimiento a través de Servicios Web

Metodología y Framework para el Desarrollo de Aplicaciones Científicas con Computación de Alto Rendimiento a través de Servicios Web Metodología y Framework para el Desarrollo de Aplicaciones Científicas con Computación de Alto Rendimiento a través de Servicios Web J.Corral-García, D.Cortés-Polo, C.Gómez-Martín, J.L.González-Sánchez

Más detalles

CLUSTER FING: PARALELISMO de MEMORIA DISTRIBUIDA

CLUSTER FING: PARALELISMO de MEMORIA DISTRIBUIDA CLUSTER FING: PARALELISMO de MEMORIA DISTRIBUIDA SERGIO NESMACHNOW Centro de Cálculo, Instituto de Computación FACULTAD DE INGENIERÍA, UNIVERSIDAD DE LA REPÚBLICA, URUGUAY CONTENIDO Introducción: arquitecturas

Más detalles

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio?

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio? Qué es Doopex? Big Data en la nube. Use los datos. Obtenga información. Seguramente, la pregunta clave no es Qué es Doopex?. La pregunta clave es: Qué puede hacer Doopex por mi negocio? El objetivo de

Más detalles

MAPREDUCE EL MODELO DETRÁS DE

MAPREDUCE EL MODELO DETRÁS DE EL MODELO DETRÁS DE MAPREDUCE MapReduce es un modelo de programación orientado al procesamiento de grandes volúmenes de datos, desarrollado específicamente para sacar ventaja del poder de procesamiento

Más detalles

CA Mainframe Chorus for DB2 Database Management versión 2.0

CA Mainframe Chorus for DB2 Database Management versión 2.0 HOJA DE PRODUCTO CA Mainframe Chorus for DB2 Database Management CA Mainframe Chorus for DB2 Database Management versión 2.0 Simplifique y dinamice su DB2 para tareas de administración de cargas de trabajo

Más detalles

WHITE PAPER. Cómo la desduplicación beneficia a empresas de todos los tamaños Documento técnico de Acronis

WHITE PAPER. Cómo la desduplicación beneficia a empresas de todos los tamaños Documento técnico de Acronis Cómo la desduplicación beneficia a empresas de todos los tamaños Documento técnico de Acronis Copyright Acronis, Inc., 2000 2009 Tabla de contenido Resumen ejecutivo... 3 Qué es la desduplicación?... 4

Más detalles

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente En este capítulo definimos los requisitos del modelo para un sistema centrado en la mejora de la calidad del código fuente.

Más detalles

Beneficios de WGABackup Online www.wiaccess.es Con el progresivo y cada vez más necesario uso de los ordenadores tanto en el trabajo como en casa, vemos como aumenta nuestra dependencia de la información

Más detalles

TIPOS DE PROCESAMIENTOS

TIPOS DE PROCESAMIENTOS TIPOS DE PROCESAMIENTOS El desempeño de un computador puede tener diferentes medidas de elección para diferentes usuarios. Para un usuario individual que está ejecutando un único programa, la computadora

Más detalles

La nomenclatura básica

La nomenclatura básica El cloud computing, explicado Salvador Pérez Crespo Tecnologías Es uno de los conceptos de moda y está llamado a revolucionar nuestra forma de trabajar. Este ameno e interesante artículo le explicará todo

Más detalles

Servicios avanzados de supercomputación para la ciència y la ingeniería

Servicios avanzados de supercomputación para la ciència y la ingeniería Servicios avanzados de supercomputación para la ciència y la ingeniería Servicios avanzados de supercomputación para la ciència y la ingeniería HPCNow! provee a sus clientes de la tecnología y soluciones

Más detalles

Implementación de servicios de análisis usando tecnología Open-Source

Implementación de servicios de análisis usando tecnología Open-Source This is a reprint of Lecturas Matemáticas Volumen 25 (2004), páginas 211 218 Implementación de servicios de análisis usando tecnología Open-Source Alexander García University of Queensland, Australia Lecturas

Más detalles

Transición de su infraestructura de Windows Server 2003 a una solución moderna de Cisco y Microsoft

Transición de su infraestructura de Windows Server 2003 a una solución moderna de Cisco y Microsoft Descripción general de la solución Transición de su infraestructura de Windows Server 2003 a una solución moderna de Cisco y Microsoft El soporte de Microsoft para todas las versiones de Windows Server

Más detalles

Conceptos de Q-flow Enterprise Edition

Conceptos de Q-flow Enterprise Edition Q-flow 2.2 Código de Manual: Qf22008ESP Versión del Manual: 1.1 Última revisión: 17/3/2006 Se aplica a: Q-flow 2.2 Enterprise Edition Conceptos de Q-flow Enterprise Edition Qf22008ESP v1.1 Q-flow Conceptos

Más detalles

Qué necesito saber para tener mi sitio web en Internet?

Qué necesito saber para tener mi sitio web en Internet? Qué necesito saber para tener mi sitio web en Internet? Introducción Antes es importante tener en cuenta que Es importante considerar lo siguiente: Definir claramente tu actividad en Internet Establecer

Más detalles

CA Automation Suite for Hybrid Clouds

CA Automation Suite for Hybrid Clouds HOJA DEL PRODUCTO: For Hybrid Clouds for Hybrid Clouds for Hybrid Clouds está diseñada para aumentar la agilidad y la eficacia, de forma que pueda hacer lo siguiente: Sobrellevar las ráfagas de demanda

Más detalles

Big Data y Supercómputo. Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE)

Big Data y Supercómputo. Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) Big Data y Supercómputo Dr. Jesús Antonio González (jagonzalez@inaoep.mx) Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) Big Data 2 Hasta qué cantidad de datos podemos procesar en nuestra

Más detalles

Computación en Red. Máster en Ingeniería de Telecomunicación. 2 º Curso. Curso Académico 2014/15

Computación en Red. Máster en Ingeniería de Telecomunicación. 2 º Curso. Curso Académico 2014/15 Computación en Red Máster en Ingeniería de Telecomunicación Curso Académico 2014/15 2 º Curso GUÍA DOCENTE Nombre de la asignatura: Computación en Red Código: 201816 Titulación en la que se imparte: Carácter:

Más detalles

Análisis de desempeño y modelo de escalabilidad para SGP

Análisis de desempeño y modelo de escalabilidad para SGP Análisis de desempeño y modelo de escalabilidad para SGP Este documento es producto de la experiencia de Analítica en pruebas de stress sobre el software SGP. Estas pruebas se realizaron sobre un proceso

Más detalles

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Problemas con los sistemas tradicionales 3 Qué es Spark? 3.1 Procesamiento de datos distribuido

Más detalles

Cloud Computing Tendencias. Modelos. Posibilidades. Germán Cortés Lasso gcorteslasso@gmail.com

Cloud Computing Tendencias. Modelos. Posibilidades. Germán Cortés Lasso gcorteslasso@gmail.com Cloud Computing Tendencias. Modelos. Posibilidades Germán Cortés Lasso gcorteslasso@gmail.com Agenda Introducción Qué es Cloud Computing? Características Modelos Tendencias Posibilidades Introducción Todos

Más detalles

Bases de datos biológicas

Bases de datos biológicas Dr. Eduardo A. RODRÍGUEZ TELLO CINVESTAV-Tamaulipas 28 de mayo del 2013 Dr. Eduardo RODRÍGUEZ T. (CINVESTAV) 28 de mayo del 2013 1 / 50 1 Introducción Desventajas de las bases de datos biológicas Recuperación

Más detalles

Ficha Técnica del curso Online de Cloud Computing con Amazon Web Services (AWS)

Ficha Técnica del curso Online de Cloud Computing con Amazon Web Services (AWS) Ficha Técnica del curso Online de Cloud Computing con Amazon Web Services (AWS) Nombre del Curso: Curso Online de Cloud Computing con Amazon Web Services (AWS) Breve descripción del Curso: Este curso online

Más detalles

Programación orientada a

Programación orientada a Programación orientada a objetos con Java Pedro Corcuera Dpto. Matemática Aplicada y Ciencias de la Computación Universidad de Cantabria corcuerp@unican.es Objetivos Presentar los conceptos de la programación

Más detalles

CONSIDERACIONES PARA LA CONTRATACIÓN DE SERVICIOS DE CÓMPUTO EN LA NUBE. Versión: 1.3

CONSIDERACIONES PARA LA CONTRATACIÓN DE SERVICIOS DE CÓMPUTO EN LA NUBE. Versión: 1.3 CONSIDERACIONES PARA LA CONTRATACIÓN DE SERVICIOS DE CÓMPUTO EN LA NUBE Versión: 1.3 Marzo 2014 INTRODUCCIÓN En la actualidad varias entidades del sector privado y público están evaluando el usar el Cómputo

Más detalles

Por qué puede ser necesario el modelado CAD 3D paramétrico y directo

Por qué puede ser necesario el modelado CAD 3D paramétrico y directo Por qué puede ser necesario el modelado CAD 3D paramétrico y directo Cinco áreas en las que el modelado paramétrico complementa el modelado directo Introducción Durante demasiado tiempo, los equipos de

Más detalles

Windows Server Hyper-V

Windows Server Hyper-V Windows Server Diseño, implantación y administración La plataforma de virtualización de Microsoft La virtualización de servidores ha sido, en la última década, una de las principales áreas de inversión

Más detalles

Uso del supercomputador Ben Arabí

Uso del supercomputador Ben Arabí Uso del supercomputador Ben Arabí CENTRO DE SUPERCOMPUTACIÓN José Ginés Picón López Técnico de aplicaciones Murcia a 11 de Marzo de 2011 Uso del supercomputador Ben Arabí Descripción de la Arquitectura

Más detalles

Diplomado en Big Data

Diplomado en Big Data 160 horas Diplomado en Big Data BROCHURE, 2015 Contenido Quienes somos?... 3 Presentación del Programa... 4 Perfíl del Facilitador. 5 Objetivos.. 6 Información General.. 7 Plan de Estudio... 8-9 Plan de

Más detalles

Trabajo final de Ingeniería

Trabajo final de Ingeniería UNIVERSIDAD ABIERTA INTERAMERICANA Trabajo final de Ingeniería Weka Data Mining Jofré Nicolás 12/10/2011 WEKA (Data Mining) Concepto de Data Mining La minería de datos (Data Mining) consiste en la extracción

Más detalles

Dirigido a: Objetivos: Alcance: Temario:

Dirigido a: Objetivos: Alcance: Temario: Dirigido a: Este curso está dirigido a personas que han utilizado Excel para tareas muy elementales y que todo lo que han aprendido ha sido de forma empírica. Algunos usuarios con nivel intermedio valoran

Más detalles

SEDA. Servicio Ejecución Distribuida de Aplicaciones. Dossier de Presentación. Versión 1.0

SEDA. Servicio Ejecución Distribuida de Aplicaciones. Dossier de Presentación. Versión 1.0 SEDA Servicio Ejecución Distribuida de Aplicaciones Dossier de Presentación Versión 1.0 2 SEDA Edificio RD Sistemas 1 ÍNDICE 1 ÍNDICE 3 2 EVOLUCIÓN TECNOLÓGICA DE RDSISTEMAS5 3 ARQUITECTURA SEDA 6 3.1

Más detalles

Gestión de Trámites Académico Administrativos a través del Sistema de Trámites en la Universidad Técnica Particular de Loja

Gestión de Trámites Académico Administrativos a través del Sistema de Trámites en la Universidad Técnica Particular de Loja Gestión de Trámites Académico Administrativos a través del Sistema de Trámites en la Universidad Técnica Particular de Loja María Eugenia Enríquez, María Paula Espinosa, María Patricia Samaniego, a Dirección

Más detalles

Paso a paso hacia el Cloud

Paso a paso hacia el Cloud Claranet Qué factores considerar antes de dar el paso Claranet S. A. U. - Juan Gris, 10-18, planta 4, torres cerdà - 08014 Barcelona Tel: 902 884 633 - Fax: +34 934 451 920 Email: info@claranet.es - Web:

Más detalles

Big data A través de una implementación

Big data A través de una implementación Big data A través de una implementación Lic. Diego Krauthamer Profesor Adjunto Interino del Área Base de Datos Universidad Abierta Interamericana Facultad de Tecnología Informática Buenos Aires. Argentina

Más detalles

Instituto Tecnológico de Costa Rica. Introducción al desarrollo de aplicaciones para web. Nombre del Proyecto: Computación en la nube

Instituto Tecnológico de Costa Rica. Introducción al desarrollo de aplicaciones para web. Nombre del Proyecto: Computación en la nube Instituto Tecnológico de Costa Rica Introducción al desarrollo de aplicaciones para web Nombre del Proyecto: Computación en la nube Estudiante Responsable: Wong Campos Andrés 200955955. Departamento Académico

Más detalles

Tecnología VoIP integrada en Sistemas de Emergencia Policiales

Tecnología VoIP integrada en Sistemas de Emergencia Policiales Tecnología VoIP integrada en Sistemas de Emergencia Policiales Mariela E. Rodriguez 1, José Farfan 2, & José V. Zapana 3 Cátedra de Modelos de Desarrollo de Programas y Programación Concurrente / Facultad

Más detalles

CLOUD COMPUTING ADAPTADO A NUESTROS CLIENTES

CLOUD COMPUTING ADAPTADO A NUESTROS CLIENTES CONSULTORÍA, SOLUCIONES Y SERVICIOS ADAPTADO A NUESTROS CLIENTES En la vanguardia del modelo de entrega del futuro indracompany.com Mapa de Gestión de TI de Indra - Estandarizació n Ahorro de costes Flexibilidad

Más detalles

Computación paralela y entornos heterogéneos

Computación paralela y entornos heterogéneos Curso 2004/05 CIENCIAS Y TECNOLOGÍAS/23 I.S.B.N.: 84-7756-662-3 LUZ MARINA MORENO DE ANTONIO Computación paralela y entornos heterogéneos Director FRANCISCO ALMEIDA RODRÍGUEZ SOPORTES AUDIOVISUALES E INFORMÁTICOS

Más detalles

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011 Clusters Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011 Introducción Aplicaciones que requieren: Grandes capacidades de cómputo: Física de partículas, aerodinámica, genómica, etc. Tradicionalmente

Más detalles

Windows 2000 Server. Manual de Windows 2000 Server

Windows 2000 Server. Manual de Windows 2000 Server Windows 2000 Server Proyecto Huascarán - Ministerio de Educación Dirección de Informática y Telecomunicaciones Área de Informática y Redes Diseño y Elaboración: Carlos A. Anchante Ch. Windows 2000 Server

Más detalles

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS UNA SESIÓN EN SPSS INTRODUCCIÓN. SPSS (Statistical Product and Service Solutions) es un paquete estadístico orientado, en principio, al ámbito de aplicación de las Ciencias sociales, es uno de las herramientas

Más detalles

LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS ELECTRÓNICOS

LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS ELECTRÓNICOS LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS LINEAMIENTOS GENERALES PARA LA IMPLEMENTACIÓN DE PROCESOS Ministerio de Tecnologías de la Información y las Comunicaciones Programa de Gobierno

Más detalles

Máster en Instalación, Gestión y Mantenimiento de CRM: Gestión de Relaciones con Clientes

Máster en Instalación, Gestión y Mantenimiento de CRM: Gestión de Relaciones con Clientes Máster en Instalación, Gestión y Mantenimiento de CRM: Gestión de Relaciones con Clientes Titulación certificada por EUROINNOVA BUSINESS SCHOOL Máster en Instalación, Gestión y Mantenimiento de CRM: Gestión

Más detalles