Mr-Cirrus: Implementación de Map-Reduce bajo MPI para la ejecución paralela de programas secuenciales

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Mr-Cirrus: Implementación de Map-Reduce bajo MPI para la ejecución paralela de programas secuenciales"

Transcripción

1 Mr-Cirrus: Implementación de Map-Reduce bajo MPI para la ejecución paralela de programas secuenciales Daniel Ramet 1, Juan Lago 2, Johan Karlsson 1, Juan Falgueras 3 y Oswaldo Trelles 1 Resumen Este documento presenta la aplicación Mr-Cirrus (Map-Reduce High Level Clouds) que permite la ejecución de programas secuenciales, sin ninguna modificación interna, trabajando en colaboración para producir un resultado coordinado en entornos de red, computación en nube (cloud computing) y multiprocesadores. El marco de desarrollo se basa en el paradigma Map- Reduce y ha sido implementada bajo MPI. De esta forma, muchas aplicaciones bioinformáticas (sobre las 200 actualmente incluyendo Dotplots, comparación de secuencias, PAML, Muscle, MAFFT, MrBayes y BLAST) pueden escalarse a través de su ejecución paralela, sin necesidad de instalaciones específicas o de alto coste, ni necesidad de conocimientos de programación en entornos multiprocesador. Se han realizado pruebas intensivas en diferentes tipos de procesos con diferentes cargas computaciones y patrones computacionales, con resultados satisfactorios. Palabras clave MapReduce, Cloud Computing, MPI, bioinformática, escalabilidad. encargadas de procesar los datos moleculares son estrictamente regulares, pero cuyo problema actual es el manejo de los nuevos volúmenes de datos y que por lo tanto se adaptan perfectamente a una ejecución paralela. Así, por ejemplo, la ejecución de una búsqueda por semejanza entre una secuencia problema y una colección de secuencias escala linealmente con el número de secuencias en la base de datos, sin ninguna dependencia de datos con respecto al orden de comparación ni a la completitud de los datos a comparar en el caso de repartir el proceso en varios subprocesos que produzcan resultados parciales. La tercera razón viene motivada por el éxito del paradigma Map-Reduce [10] en entornos de computación de alto rendimiento. Su facilidad de uso matiza de forma efectiva la falta de programadores especializados en construir software de alto rendimiento. Se estima que menos del 1% de los desarrolladores de software a nivel mundial están entrenados en computación paralela, y dar el salto a ella no es en absoluto trivial. L I. INTRODUCCIÓN A computación en la nube o cloud computing [1] ha reinventado el tradicional Centro de Datos (data center) para la prestación de servicios computacionales, con una rápida introducción y aceptación en distintos sectores y ámbitos de actividad [2]. Esto es así en gran medida porque la computación en la Cloud promete, y en muchas situaciones lo consigue, recortes en los costes operativos y de capital en la gestión de los recursos computacionales de las instituciones por el ahorro en la adquisición de la infraestructura a cambio de alquilar un recurso de pago-a-demanda según consumo de los recursos (computación, almacenamiento, ancho de banda, etc) y evitando la gestión de las tareas de mantenimiento y puesta a punto del centro de datos. Hay proveedores de servicios en Cloud (como por ejemplo Google App Engine [3], Microsoft Azure [4], IBM Smart Cloud [5] y Amazon EC2 [6]) que ofrecen cantidades importantes de CPU y almacenamiento bajo un software de gestión robusto y sobre cuyas plataformas es relativamente simple instalar una infraestructura en cuestión de minutos [7]. Por otra parte, el espectacular incremento en la producción de datos moleculares (del orden de los Tera y Petabytes) [8,9] y la necesidad de analizar múltiples hipótesis bajo diversos escenarios hace que el análisis de datos genómicos en la biología actual requiera de una potencia computacional que debe ser buscada en la computación paralela. También debemos tener presente que una buena parte de las aplicaciones bioinformáticas 1. Dpto. de Arquitectura de Computadores, Universidad de Málaga. dramet, tjkarlsson, 2. Dpto. de Innovación y Tecnología, Fundación IAVANTE. 3. Dpto. de Lenguajes y Ciencias de la Computación, Universidad de Málaga. En este contexto, el objetivo principal de este trabajo es proporcionar un marco de ejecución de aplicaciones secuenciales, con la premisa de no modificarlas en absoluto, en varias instancias paralelas. El esquema se basa en un gestor de la ejecución que hace a la vez de lanzador de instancias, y dos programas externos para asignar la carga sobre las instancias (map); y para recolectar los resultados parciales y producir un resultado integrado final (reduce). En ambos casos se trata de programas relativamente simples y que no demandan habilidades de programación paralela. Para validar y evaluar el sistema se han elegido dos aplicaciones representativas en el área de la bioinformática; una con un gran número de tareas independientes de pequeños volúmenes de datos (búsquedas por semejanza) y la otra con una sola tarea pero un gran volumen de datos (matrices de puntos). Estas aplicaciones presentan muchas de las características de los procesos actuales en genómica; elevada E-S, gran consumo de memoria y demanda de CPU. Su evaluación nos proporciona información importante para portar al entorno un gran conjunto de aplicaciones con estructura computacional similar. II. MÉTODOS Y SISTEMAS A. El gestor de instancias El diseño del esquema de gestión de la ejecución paralela de programas secuenciales se ha representado en la figura 1. Un proceso maestro es el encargado de la creación de las instancias (servidores) que a su vez

2 invocan al proceso secuencial de acuerdo a las especificación que el maestro ha leído del fichero de mapeo. Los procesos secuenciales ejecutan trabajos parciales e informan de su finalización al servidor quien maneja sus comunicaciones con el maestro, y quien a la finalización de todos los procesos servidores invoca el proceso de reducción o recolección de resultados parciales. Una secuencia genómica S n es una cadena de símbolos {x 1, x 2,..., x n } que pertenecen al alfabeto del ADN (x i A {A, C, G, T}). La matriz de puntos es uno de los métodos más antiguos de comparación de secuencias moleculares [11]. En términos simples, se trata de una representación visual del parecido entre dos secuencias. Una se dispone en horizontal y la otra en vertical y la matriz de puntos se construye comparando cada símbolo de ambas secuencias, ubicando un punto en la celda de intersección de coordenadas cuando los elementos son iguales. De esta forma, las regiones de las secuencias que comparten un parecido sustancial aparecerán como fragmentos diagonales en la matriz. El método estándar para reducir el ruido de los parecidos aleatorios de pequeños fragmentos utiliza una ventana deslizante de un determinado tamaño, de forma que solo resulte en un punto los fragmentos en la ventana cuyo parecido supere un umbral prefijado. Hay muchas y antiguas extensiones a esta metodología básica, que incluyen la fijación interactiva del umbral [12], [13], filtros estadísticos y el uso de diversos símbolos para discriminar las señales [14], el uso de colores para representar la información [15], y se ha extendido la capacidad interactiva [16, 17], incluyendo aplicaciones Web [11], con las típicas capacidades de navegación. Fig. 1. En la parte superior se esquematiza el proceso de asignación o distribución de la carga (map) y la generación de los scripts de ejecución. Un proceso maestro con los respectivos servidores, en el centro, se encargan de realizar las tareas parciales; para finalmente en un proceso de reducción producir el resultado integrado final (reduce). Tanto los procesos de distribución de recursos como los de colección de resultados se especifican a través de ficheros que pueden ser producidos automáticamente por pequeños y simples programas de distribucióncolección de la carga. Estos son los únicos programas que necesitan ser escritos para completar el sistema y muchas veces corresponden a conjuntos o lotes de comandos del sistema operativo. El proceso maestro está preparado para ser tolerante a los fallos de procesos, redistribuyendo la carga no resuelta y para lanzar la totalidad de las instancias por partes o etapas de acuerdo a los recursos disponibles. Ello permite el diseño con distribuciones de carga de tamaño variable a fin de reducir el coste de planificación, y mejorar la sincronización final de los procesos para tareas de baja regularidad. B. Las aplicaciones a implementar 1) Las matrices de puntos Estas referencias nos permiten analizar algunos aspectos computacionales. Estrictamente hablando, la propuesta inicial que realiza la comparación a nivel de símbolo, no requiere las secuencias ni la matriz de puntos en memoria. Bastaría con tener una de las secuencias o parte de ella en memoria e ir trabajando un símbolo a la vez de la segunda secuencia, para mostrar en una pantalla un punto o no. Sin embargo, ya el uso de la ventana deslizante requiere al menos parte de la segunda secuencia en memoria. Finalmente, la interactividad sobre la matriz de resultados requiere que las aplicaciones gestionen la matriz de puntos en memoria. Esto era posible porque se trabajaba sobre las secuencias relativamente pequeñas que se disponían (genes o genomas de pequeños virus de algunos pocos KB). Sin embargo, hoy en día se dispone de información de genomas completos de organismos superiores, entre ellos el humano, con algunos GB de símbolos (el genoma humano sobrepasa los 3 GB y sus cromosomas son de algunos cientos de MB). Aún por separado, tanto el cálculo como la visualización de la matriz de puntos representan grandes retos computacionales. Por ejemplo, la comparación de dos genomas medios de bacterias de 3 Mb, en un equipo capaz de comparar 100 MB, usando una ventana de un solo símbolo necesitaría alrededor de 25 horas, [16]. Cada incremento de una unidad en el tamaño de la ventana representaría un día más de tiempo de computación. Por otra parte, las aplicaciones de análisis interactivo requieren la matriz en memoria. En [18] propusimos gestionar la matriz a distintos niveles de resolución llegando a manejar matrices con algunos, notables para su momento, cientos de KB de longitud. Más adelante, en [15] se

3 presenta una aplicación para visualizar grandes alineamientos y en [19], se hizo en Web. 2) Comparación de secuencias biológicas La comparación de secuencias biológicas es posiblemente la aplicación de mayor uso en bioinformática. En esencia, dada una secuencia problema y una colección de secuencias conocidas, se trata de identificar aquellas secuencias en la colección que más se parezcan a la secuencia problema. De estas relaciones se pueden inferir relaciones evolutivas, estructurales o funcionales entre las secuencias. En términos más formales, dada una secuencia S Q y un conjunto de secuencias D = {S 1, S 2,..., S n } se debe comparar S Q contra cada una de las secuencias del conjunto D a fin de identificar aquellas S i, i {1 n}. III. RESULTADOS A. Los procesos de distribución y reducción Los procesos de asignación de carga a procesos (Map) y colección de resultados (Reduce) se han diseñado para que puedan ser preparados de forma externa tanto a la aplicación secuencial como al gestor de la ejecución. En el primer caso de estudio, la matriz de puntos se construye para dos secuencias S x y S y, por lo que la distribución de carga más simple es la de repartir el espacio computacional L x L y, donde L x y L y son las longitudes de las secuencias respectivas. Para ello, se parte cada una de las secuencias en N x y N y trozos para luego invocar el programa para cada combinación S i y S j i=1... N x ; y j=1...n y ), lo que producirá resultados parciales RES(i,j) que serán unidos por un proceso de Reducción para producir la super-matriz final. Es interesante indicar que este proceso genera además los scripts que permiten lanzar directamente las instancias (incluso en una máquina monoprocesadora). que las tareas que involucren a las secuencias largas gobernarán la eficiencia del sistema. Por ello, la distribución de la base de datos (conjunto conocido de secuencias) no solo es importante, sino que debe realizarse de forma que minimice la latencia de inicio (con mínimo de lanzamiento de instancias) y facilite la sincronización de finalización mediante, en ambos casos, de las tareas livianas al inicio y final del procesamiento en paralelo. El coste de planificación está asociado al número de tareas a distribuir (en nuestro caso especialmente por la latencia de lanzar una nueva instancia) y al tamaño de las últimas tareas a distribuir. La planificación guiada (Guided Self Scheduling) se planteó este problema. Dado un número n de instancias a crear en paralelo, la mejor solución en la que permite a todas las instancias finalizar con una diferencia máxima de B unidades de tiempo, siendo B el tiempo necesario para realizar un bloque básico de tareas. El razonamiento es el de asignar en la i-ésima distribución x i bloques, dejando suficientes bloques para distribuir a los n-1 instancias. Para conseguirlo, sea N el número de bloques de tareas, entonces x i queda definido por: x i = R i / n R i+1 = R i - x i donde R 1 = N Nosotros propusimos una modificación de esta distribución bajo la observación de que las tareas grandes que se generan en las primera iteraciones (ver tabla 1) produce una gran latencia tanto por el lanzamiento de la instancia pero especialmente por la llegada de los datos, llegando a producir incluso TABLA 1 TAMAÑOS DE LOS BLOQUES A DISTRIBUIR USANDO GSS Y NUESTRO GSS MODIFICADO (GSS-MOD) PARA N=100 Y 4 PROCESADORES. El segundo caso, búsquedas de secuencias por semejanza, presenta dos variantes. Una primera se presenta cuando se dispone de varias secuencias S Q (Q=1...N) y por tanto la primera distribución es la de repartir cada una de las secuencias a cada proceso. En el segundo caso se trata de procesar una sola secuencia S Q que se compara contra todas las secuencias del conjunto, por lo que en este caso lo natural es distribuir la colección de secuencias. Se debe observar que ambas soluciones pueden a su vez combinarse para formar una tercera opción que consistiría en separar secuencias y distribuir también el conjunto de secuencias conocidas. Es importante destacar que la primera variante puede presentar serios problemas de eficiencia cuando el número de secuencias problema (S Q ) es muy pequeño, y cuando las diferencias de longitud de las secuencias en dicho conjunto sean significativas, lo que supone

4 inanición en las últimas instancias (este hecho fue confirmado en los experimentos del trabajo de Google [10]). Estas modificaciones se traducen en los siguiente cálculos: x i = R i / n x -i+1 = x i R i+1 = R i - x i siendo R 1 = N / 2 B. Evaluación Para evaluar la solución propuesta hemos utilizado el cluster de la Red Española de Supercomputación, ubicado en el Centro de Bioinnovación de la Universidad de Málaga. Este cluster de memoria distribuida de la marca IBM está compuesto por 256 nodos JS20-IBM, cada nodo con 2 CPU IBM PowerPC single-core 970FX de 64bits a 2GHz, y 1 TB de memoria distribuida. La programación se ha realizado en C, usando la librería de paso de mensajes MPI. Para las primeras pruebas realizadas sobre la aplicación de matrices de puntos, se han usado dos secuencias de aproximadamente 1 MB de longitud, de las cepas APS y BPS de la bacteria Buchnera aphidicola (el primer genoma eucariota secuenciado en España); y también variaciones en tamaño de estas secuencias para observar el comportamiento con referencia al espacio computacional a distribuir. Para la segunda aplicación se ha seleccionado un conjunto de secuencias de la base de datos swissprot (80 mil secuencias) y se han seleccionado de ella 100 secuencias que serán usadas como conjunto problema (estas secuencias fueron a su vez eliminadas del conjunto conocido de secuencias). En cada una de las pruebas se han utilizado diferente número de instancias de los procesos a fin de evaluar la escalabilidad. La tabla 2 muestra los resultados de las pruebas donde se puede apreciar que se han utilizado distintos tamaños para validar la eficacia de la propuesta ante diferentes tamaños de carga. Fig. 2. Composición de los resultados parciales del proceso de la matriz de puntos, utilizando para ello dos secuencias de 2 y 3KB de longitud con diferente particionado. matrices parciales que conforman la matriz de punto de dos secuencias, obtenidas por seis procesos diferentes. Finalmente en la figura 3 se muestran los tiempos y la gráfica de aceleración correspondientes para los tests realizados. Para la aplicación de las Matrices de Puntos, se han usado los genomas de las bacterias Buchnera TABLA 2 DETALLES DE LOS CONJUNTOS DE PRUEBA. TAMAÑO DE LAS SECUENCIAS EN LOS DOTPLOTS Y DE LOS CONJUNTOS PROBLEMA EN LAS BÚSQUEDAS POR SEMEJANZA. ACELERACIÓN 2 PE 4 PE 8 PE 16 PE 32 PE 64 PE Óptima 2,00 4,00 8,00 16,00 32,00 64,00 Dotplot Buchnera 2,00 3,87 7,58 14,17 25,13 53,06 Frag. E.Coli y B.Subtilis 1,96 3,80 7,84 15,84 31,04 61,44 Fragmentos Buchnera 1,95 3,78 8,00 16,00 31,68 59,58 Blast singletons 1,98 3,96 7,88 15,74 30,86 56,66 Los programas se han comprobado a fin de confirmar que reproducen los resultados originales como se muestra en la figura 2, en la que se muestran las seis Fig.3. Resultados de aceleración en las implementaciones propuestas, en las que se observa un comportamiento cercano al ideal tanto para el proceso de la matriz de puntos, para la obtención de todos los fragmentos mayores que una longitud mínima (a partir de ahora, Fragmentos), y para el Blast en ejecuciones de casos reales. Para el caso de los Dotplots y Fragmentos, estos resultados corresponden a las secuencias Buchnera APS y BPS (600 KB), mientras que para Blast se han utilizado un conjunto de contigs y singletons que hacen las veces de secuencias problema. Para conjuntos de datos mayores, los resultados son incluso mejores, demostrando la escalabilidad de la solución, tal y como se puede ver en la ejecución de Fragmentos para las bacterias E. Coli (4,5 MB) y B. Subtilis (4,1 MB). Para datos de tiempos, ver la tabla 3.

5 TABLA 3 DETALLES DE LOS DATOS DE TIEMPO ASOCIADOS A LAS IMPLEMENTACIONES PROPUESTAS (CONTINUACIÓN FIGURA 3). Dotplot Buchnera TIEMPO 2 PE 4 PE 8 PE 16 PE 32 PE 64 PE Óptimo 03:21:48 01:40:54 00:50:27 00:25:14 00:12:37 00:06:19 Map-Reduce 03:19:47 01:44:17 00:53:07 00:30:00 00:15:20 00:07:24 Fragmentos E. Coli y B. Óptimo 50:40:00 25:20:00 12:40:00 06:20:00 03:10:00 01:35:00 Subtilis Map-Reduce 51:40:00 26:40:00 12:49:25 06:21:40 03:14:50 01:38:00 Fragmentos Buchnera Blast singletons Óptimo 01:05:00 00:32:30 00:16:15 00:08:08 00:04:04 00:02:02 Map-Reduce 01:06:37 00:34:17 00:16:15 00:08:08 00:04:06 00:02:10 Óptimo 00:58:10 00:29:05 00:14:33 00:07:17 00:03:39 00:01:50 Map-Reduce 00:58:37 00:29:21 00:14:46 00:07:24 00:03:47 00:02:02 APS y BPS de algo más de 600 KB de longitud; mientras que en las Comparaciones por Semejanza, se han utilizado secuencias (singletons procedentes de un proceso de ensamblaje) que son contrastadas contra grupos (contigs) de secuencias. También se han realizado pruebas con una carga de datos mayor como son las bacterias E. Coli y B. Subtilis de más de 4 MB de longitud mediante la comparación por semejanza. Los resultados indican que estas implementaciones escalan linealmente con el número de procesadores con aceleraciones cercanas a la máxima. Se ha probado el rendimiento para volúmenes de datos o carga computacional menor, y como cabría esperar, cuando el número de procesadores crece, la carga por proceso no es suficiente para compensar la latencia de inicio de los procesos y, por tanto, el número de procesadores debe fijarse en función de la carga para alcanzar buenos rendimientos. IV. CONCLUSIONES La computación en la Cloud abre nuevas oportunidades para acercar la computación de alto rendimiento a laboratorios que requieren procesar grandes cantidades de datos pero que no disponen de infraestructura computacional adecuada. Por otra parte, la bioinformática ha despegado como una línea de investigación en la que el desarrollo de software tiene que lidiar con el problema de los grandes conjuntos de datos. Existe una gran diversidad de aplicaciones en este campo, pero en su práctica totalidad están preparadas para una ejecución secuencial y unas condiciones que ya han dejado de estar presentes. Este documento se centra en el desarrollo de un marco de trabajo que permita la reutilización de estas aplicaciones en entornos paralelos, exigiendo que no se toque el código secuencial ya que muchas de ellas son aplicaciones bastante antiguas aunque válidas (legacy applications). El desarrollo es en idea sencillo, aunque requiere una programación eficiente y cuidadosa para manejar situaciones de conflicto, como es el fallo de procesos, su sincronización, y el balanceo de la carga. Los mayores problemas encontrados, como era de esperar, han sido en el ámbito de la E-S. Para el caso de redes de ordenadores, siempre es posible utilizar los discos locales para evitar el cuello de botella en el sistema de almacenamiento al concurrir a él cientos y potencialmente miles de procesos. Cuando no se dispone de este sistema distribuido de almacenamiento, el cuello de botella impide escalar bien a la aplicación. Por ello en algunos casos es necesario abordar tanto la reformulación como el diseño de nuevo software. También es cierto que el sistema es válido para aplicaciones que deben llevar adelante una serie de tareas más o menos homogéneas y que procesos de una sola tarea y con grandes dependencias de datos, son en principio difíciles de adecuar a este entorno. Sin embargo, una estimación realizada en nuestro grupo, calcula que no más del 20% de los programas bioinformáticos tienen este diseño, por lo que la aproximación sigue siendo válida para el gran porcentaje de aplicaciones bioinformáticas. Aunque las aplicaciones presentadas en este documento tienen un patrón de cálculo bastante regular (en el caso de los dotplots se ha usado un código de fuerza bruta) la introducción de heterogeneidad en las tareas (que no la de interdependencias) es aún manejable vía el uso de una distribución de carga más inteligente (guiada, por ejemplo) con resultados satisfactorios. Por tanto, no hay dependencia con la optimización de los cálculos que puedan introducir nuevas versiones de los algoritmos. Finalmente, el desarrollo de este entorno de trabajo permitirá llevar a una ejecución paralela a cientos de programas en el ámbito bioinformático, abriendo nuevas oportunidades para el análisis de datos y para la ciencia en general. AGRADECIMIENTOS Este trabajo ha sido parcialmente financiado por el Instituto Nacional de Bioinformática, plataforma del Instituto de Salud Carlos III; la Acción Integrada del Programa Nacional de Internacionalización de la I+D; Subprograma: Acciones Integradas 2009; Ministerio de Ciencia e Innovación. Referencia AT y el programa Virtual Multidisciplinary EnviroNments USing Cloud Infrastructures, FP7-VENUS-C (www.venus-c.eu). REFERENCIAS [1] Armbrust M, Fox, et al. Above the Clouds: A Berkeley View of Cloud Computing. Technical report

6 [http://www.eecs.berkeley.edu/pubs/techrpts/2009/eecs pdf]. [2] Press Release: Gartner s 2009 Hype Cycle Special Report Evaluates Maturity of 1,650 Technologies. [http://www.gartner.com/it/page.jsp?id= ]. [3] Google App.Engine: Welcome to the Google Apps; [4] What is the Windows Azure platform?; [5] IBM smart Cloud: [6] Amazon Elastic Compute Cloud: [7] Amazon. Build a Cluster Computing Environment in under 10 minutes. 10/ [8] Editorial, Big data: Welcome to the petacentre, Nature 455, (2008) doi: /455016a [9] 1000 Genomes: A Deep Catalog of Human Genetic Variation (http://www.1000genomes.org). [10] Dean, J. and Ghemawat, S. MapReduce: simplified data processing on large clusters. "Comm. ACM", 51, ), [11 Gibbs, A.J. and McIntyre, G.A. The Diagram, a Method for Comparing Sequences, Its Use with Amino Acid and Nucleotide Sequences. European J. Biochemistry, vol. 16, pp. 1-11, [12] Maizel, J.V. and Lenk, R.P. Enhanced Graphic Matrix Analysis of Nucleic Acid and Protein Sequences. Proceedings of the National Academy of Science, USA 78, 12, [13] Staden, R. An interactive graphics program for comparing and aligning nucleic acid and amino acid sequences, Nucleic Acids Research, 1982, Vol. 10, No [14] Pustell and Kafatos, 1984J. Pustell and F.C. Kafatos, A convenient and adaptable package of computer programs for DNA and protein sequence management, analysis and homology determination, Nucl. Acids Res. 12 (1984), pp [15] Reisner, H and Bucholtz. The use of various properties of amino acids in color and monochrome dot-matrix analyses for protein homologies. Bioinformatics, Volume 4, Number 3Pp [16] Nedde, D.N. and Ward, M.O. Visualizing relationships between nucleic acid sequences using correlation images. CABIOS, 9(3): [17] Trelles-Salazar, O.; Zapata, E.L.; Dopazo, J.; Coulson, A.W.F and Carazo, J.M. An Image processing approach to DotPlots : An X window-based program for interactive analysis of dotplots derived from sequence and structural data, CABIOS (11) 3: [18] Schwartz,S PipMaker- a web server for aligning two genomic DNA sequences. Genome Res., 10, , [19] Trelles-Salazar, O.; Zapata, E.L.; Dopazo, J.; Coulson, A.W.F and J.M.Carazo. An Image processing approach to DotPlots : An X window-based program for interactive analysis of dotplots derived from sequence and structural data, CABIOS (11) 3:

Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la

Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la Es un software del tipo MAP-REDUCE realizada usando la librería MPI para la ejecución de programas secuenciales de forma paralela con el requisito de no modificar los programas secuenciales. La idea fundamental

Más detalles

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente

Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente Capítulo 4. Requisitos del modelo para la mejora de la calidad de código fuente En este capítulo definimos los requisitos del modelo para un sistema centrado en la mejora de la calidad del código fuente.

Más detalles

Arquitectura de Aplicaciones

Arquitectura de Aplicaciones 1 Capítulo 13: Arquitectura de aplicaciones. - Sommerville Contenidos del capítulo 13.1 Sistemas de procesamiento de datos 13.2 Sistemas de procesamiento de transacciones 13.3 Sistemas de procesamiento

Más detalles

Cloud Computing. Rodrigo Moreno Rosales DN-11

Cloud Computing. Rodrigo Moreno Rosales DN-11 Cloud Computing Rodrigo Moreno Rosales DN-11 Cloud Computing La computación en la nube,conocido también como servicios en la nube, informática en la nube, nube de cómputo o nube de conceptos, es un paradigma

Más detalles

GPU IMPLEMENTATIONS OF SCHEDULING HEURISTICS FOR HETEROGENEOUS COMPUTING ENVIRONMENTS

GPU IMPLEMENTATIONS OF SCHEDULING HEURISTICS FOR HETEROGENEOUS COMPUTING ENVIRONMENTS GPU IMPLEMENTATIONS OF SCHEDULING HEURISTICS FOR HETEROGENEOUS COMPUTING ENVIRONMENTS MAURO CANABÉ SERGIO NESMACHNOW Centro de Cálculo, Facultad de Ingeniería Universidad de la República, Uruguay GPU IMPLEMENTATIONS

Más detalles

SEDA. Servicio Ejecución Distribuida de Aplicaciones. Dossier de Presentación. Versión 1.0

SEDA. Servicio Ejecución Distribuida de Aplicaciones. Dossier de Presentación. Versión 1.0 SEDA Servicio Ejecución Distribuida de Aplicaciones Dossier de Presentación Versión 1.0 2 SEDA Edificio RD Sistemas 1 ÍNDICE 1 ÍNDICE 3 2 EVOLUCIÓN TECNOLÓGICA DE RDSISTEMAS5 3 ARQUITECTURA SEDA 6 3.1

Más detalles

Metodología y Framework para el Desarrollo de Aplicaciones Científicas con Computación de Alto Rendimiento a través de Servicios Web

Metodología y Framework para el Desarrollo de Aplicaciones Científicas con Computación de Alto Rendimiento a través de Servicios Web Metodología y Framework para el Desarrollo de Aplicaciones Científicas con Computación de Alto Rendimiento a través de Servicios Web J.Corral-García, D.Cortés-Polo, C.Gómez-Martín, J.L.González-Sánchez

Más detalles

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928

Alessandro Chacón 05-38019. Ernesto Level 05-38402. Ricardo Santana 05-38928 Alessandro Chacón 05-38019 Ernesto Level 05-38402 Ricardo Santana 05-38928 CONTENIDO Universo Digital Hadoop HDFS: Hadoop Distributed File System MapReduce UNIVERSO DIGITAL 161 EB 2006 Fuente: International

Más detalles

Servicios avanzados de supercomputación para la ciència y la ingeniería

Servicios avanzados de supercomputación para la ciència y la ingeniería Servicios avanzados de supercomputación para la ciència y la ingeniería Servicios avanzados de supercomputación para la ciència y la ingeniería HPCNow! provee a sus clientes de la tecnología y soluciones

Más detalles

La filosofía open source en la bioinformática

La filosofía open source en la bioinformática 03-09-2009 La filosofía open source en la bioinformática Desde hace una década el fenómeno open source o código abierto ha explotado y sus efectos se pueden ver en todas partes y también en la ciencia.

Más detalles

CURSOS DE VERANO 2014

CURSOS DE VERANO 2014 CURSOS DE VERANO 2014 CLOUD COMPUTING: LA INFORMÁTICA COMO SERVICIO EN INTERNET LA PLATAFORMA GOOGLE CLOUD PLATFORM. GOOGLE APP ENGINE Pedro A. Castillo Valdivieso Universidad de Granada http://bit.ly/unia2014

Más detalles

SBDA-GRID: implementación de un servicio de base de datos en una arquitectura grid

SBDA-GRID: implementación de un servicio de base de datos en una arquitectura grid SBDA-GRID: implementación de un servicio de base de datos en una arquitectura grid Nancy Ocotitla Rojas, Axel E. Moreno Cervantes, Rogelio Castro González Escuela Superior de Cómputo-IPN, Av. Juan de Dios

Más detalles

MS_20247 Configuring and Deploying a Private Cloud

MS_20247 Configuring and Deploying a Private Cloud Gold Learning Gold Business Intelligence Silver Data Plataform Configuring and Deploying a Private Cloud www.ked.com.mx Por favor no imprimas este documento si no es necesario. Introducción. Este curso

Más detalles

CENTRO DE RESGUARDO ARQUITECTURA AVANZADA PROF.: JUAN JOSÉ MUÑOZ BUSSI AUTOR: MARIANA FERRETTO

CENTRO DE RESGUARDO ARQUITECTURA AVANZADA PROF.: JUAN JOSÉ MUÑOZ BUSSI AUTOR: MARIANA FERRETTO CENTRO DE RESGUARDO ARQUITECTURA AVANZADA PROF.: JUAN JOSÉ MUÑOZ BUSSI AUTOR: MARIANA FERRETTO CENTRO DE RESGUARDO Centro de Cómputos de Resguardo Sitio para reubicarse luego de un desastre Sitio manejado

Más detalles

Intel Tera-Scale Computing Alumno: Roberto Rodriguez Alcala

Intel Tera-Scale Computing Alumno: Roberto Rodriguez Alcala Intel Tera-Scale Computing Alumno: Roberto Rodriguez Alcala 1. Introducción Los procesadores con dos núcleos existen actualmente, y los procesadores de cuatro están insertándose en el mercado lentamente,

Más detalles

PROYECTO REALIZADO POR: ENTIDAD GESTORA: COFINANCIADO POR:

PROYECTO REALIZADO POR: ENTIDAD GESTORA: COFINANCIADO POR: CLOUD COMPUTING PROYECTO REALIZADO POR: ENTIDAD GESTORA: COFINANCIADO POR: 1. Introducción 1. Qué es el Cloud Computing? La computación en nube es un sistema informático basado en Internet y centros de

Más detalles

Diseño del Sistema de Información

Diseño del Sistema de Información Diseño del Sistema de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS...2 ACTIVIDAD DSI 1: DEFINICIÓN DE LA ARQUITECTURA DEL SISTEMA...7 Tarea DSI 1.1: Definición de Niveles de Arquitectura...9 Tarea DSI 1.2:

Más detalles

13º Unidad Didáctica. RAID (Redundant Array of Independent Disks) Eduard Lara

13º Unidad Didáctica. RAID (Redundant Array of Independent Disks) Eduard Lara 13º Unidad Didáctica RAID (Redundant Array of Independent Disks) Eduard Lara 1 RAID: INTRODUCCIÓN Sistema de almacenamiento que usa múltiples discos duros entre los que distribuye o replica los datos.

Más detalles

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co

Big Data: retos a nivel de desarrollo. Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Big Data: retos a nivel de desarrollo Ing. Jorge Camargo, MSc, PhD (c) jcamargo@bigdatasolubons.co Cámara de Comercio de Bogotá Centro Empresarial Chapinero Agenda Introducción Bases de datos NoSQL Procesamiento

Más detalles

Mantenimiento de Sistemas de Información

Mantenimiento de Sistemas de Información de Sistemas de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 1 ACTIVIDAD MSI 1: REGISTRO DE LA PETICIÓN...4 Tarea MSI 1.1: Registro de la Petición... 4 Tarea MSI 1.2: Asignación de la Petición... 5 ACTIVIDAD

Más detalles

PCI 2010 Acción Preparatoria. Computación Avanzada en Aplicaciones Biomédicas. (High Performance Computing applied to Life Sciences)

PCI 2010 Acción Preparatoria. Computación Avanzada en Aplicaciones Biomédicas. (High Performance Computing applied to Life Sciences) PCI 2010 Acción Preparatoria Computación Avanzada en Aplicaciones Biomédicas CaaB (High Performance Computing applied to Life Sciences) Descripción general Participantes Universidad de Málaga, España CIEMAT,

Más detalles

MS_20488 Developing Microsoft SharePoint Server 2013 Core Solutions

MS_20488 Developing Microsoft SharePoint Server 2013 Core Solutions S MS_20488 Developing Microsoft SharePoint Server 2013 Core Solutions www.ked.com.mx Av. Revolución No. 374 Col. San Pedro de los Pinos, C.P. 03800, México, D.F. Tel/Fax: 52785560 Introducción En este

Más detalles

CA Mainframe Chorus for DB2 Database Management versión 2.0

CA Mainframe Chorus for DB2 Database Management versión 2.0 HOJA DE PRODUCTO CA Mainframe Chorus for DB2 Database Management CA Mainframe Chorus for DB2 Database Management versión 2.0 Simplifique y dinamice su DB2 para tareas de administración de cargas de trabajo

Más detalles

EMC SCALEIO SAN de servidor convergente definida por software

EMC SCALEIO SAN de servidor convergente definida por software EMC SCALEIO SAN de servidor convergente definida por software ASPECTOS FUNDAMENTALES Solo para software Arquitectura convergente de capa simple Escalabilidad lineal Rendimiento y capacidad según demanda

Más detalles

Transición de su infraestructura de Windows Server 2003 a una solución moderna de Cisco y Microsoft

Transición de su infraestructura de Windows Server 2003 a una solución moderna de Cisco y Microsoft Descripción general de la solución Transición de su infraestructura de Windows Server 2003 a una solución moderna de Cisco y Microsoft El soporte de Microsoft para todas las versiones de Windows Server

Más detalles

4. Programación Paralela

4. Programación Paralela 4. Programación Paralela La necesidad que surge para resolver problemas que requieren tiempo elevado de cómputo origina lo que hoy se conoce como computación paralela. Mediante el uso concurrente de varios

Más detalles

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK. www.formacionhadoop.com CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK www.formacionhadoop.com Índice 1 Qué es Big Data? 2 Problemas con los sistemas tradicionales 3 Qué es Spark? 3.1 Procesamiento de datos distribuido

Más detalles

Acerca de esté Catálogo

Acerca de esté Catálogo Catálogo de Cursos 2015 Acerca de esté Catálogo En el presente documento podrá obtenerse la información necesaria sobre la oferta de cursos que Manar Technologies S.A.S. y su línea de educación Campus

Más detalles

Unidad II: Administración de Procesos y del procesador

Unidad II: Administración de Procesos y del procesador Unidad II: Administración de Procesos y del procesador 2.1 Concepto de proceso Un proceso no es más que un programa en ejecución, e incluye los valores actuales del contador de programa, los registros

Más detalles

Módulo: Modelos de programación para Big Data

Módulo: Modelos de programación para Big Data Program. paralela/distribuida Módulo: Modelos de programación para Big Data (título original: Entornos de programación paralela basados en modelos/paradigmas) Fernando Pérez Costoya Introducción Big Data

Más detalles

Diseño del Sistema de Información

Diseño del Sistema de Información Diseño del Sistema de Información ÍNDICE DESCRIPCIÓN Y OBJETIVOS... 2 ACTIVIDAD DSI 1: DEFINICIÓN DE LA ARQUITECTURA DEL SISTEMA... 7 Tarea DSI 1.1: Definición de Niveles de Arquitectura... 9 Tarea DSI

Más detalles

UNIVERSIDAD CARLOS III DE MADRID

UNIVERSIDAD CARLOS III DE MADRID : Grupo de Arquitectura de Computadores, Comunicaciones y Sistemas A R C O S I V E R S ID A D U N III I D R D A M D E I C A R L O S II UNIVERSIDAD CARLOS III DE MADRID Grupo de Arquitectura de Computadores,

Más detalles

CURSOS DE VERANO 2014

CURSOS DE VERANO 2014 CURSOS DE VERANO 2014 CLOUD COMPUTING: LA INFORMÁTICA COMO SERVICIO EN INTERNET La plataforma Google Cloud Platform. Google App Engine Pedro A. Castillo Valdivieso Universidad de Granada La plataforma

Más detalles

Sybase IQ Servidor analítico con arquitectura basada en columnas

Sybase IQ Servidor analítico con arquitectura basada en columnas Sybase IQ Servidor analítico con arquitectura basada en columnas www.sybase.es Sybase IQ Descripción Tener acceso a toda la información de que dispone su organización, con el fin de analizarla no es hoy

Más detalles

UNIVERSIDAD PONTIFICIA DE SALAMANCA. Faculta de Informática

UNIVERSIDAD PONTIFICIA DE SALAMANCA. Faculta de Informática UNIVERSIDAD PONTIFICIA DE SALAMANCA Faculta de Informática Sistemas de Información y Auditoría de Sistemas de Información Modelos de servicio en Cloud Computing (SaaS, PaaS, IaaS) Alumno:!!! Alberto Balado

Más detalles

WebSphere Extended Deployment

WebSphere Extended Deployment IBM Software Group WebSphere Extended Deployment Gestión de Efectividad y Capacidad Agenda WebSphere Extended Deployment: Introducción Dynamic Operations Extended Manageability High Performance Computing

Más detalles

Arquitecturas de computadoras

Arquitecturas de computadoras Arquitecturas de computadoras Colaboratorio Nacional de Computación Avanzada (CNCA) 2014 Contenidos 1 Computadoras 2 Estación de Trabajo 3 Servidor 4 Cluster 5 Malla 6 Nube 7 Conclusiones Computadoras

Más detalles

SQL Server Reporting Services 2000 y 2005

SQL Server Reporting Services 2000 y 2005 SQL Server Reporting Services 2000 y 2005 Este artículo presenta SQL Server Reporting Services. Se presentan primero las funcionalidades de la primera versión de esta herramienta y después las mejoras

Más detalles

Qué necesito saber para tener mi sitio web en Internet?

Qué necesito saber para tener mi sitio web en Internet? Qué necesito saber para tener mi sitio web en Internet? Introducción Antes es importante tener en cuenta que Es importante considerar lo siguiente: Definir claramente tu actividad en Internet Establecer

Más detalles

CLUSTER FING: PARALELISMO de MEMORIA DISTRIBUIDA

CLUSTER FING: PARALELISMO de MEMORIA DISTRIBUIDA CLUSTER FING: PARALELISMO de MEMORIA DISTRIBUIDA SERGIO NESMACHNOW Centro de Cálculo, Instituto de Computación FACULTAD DE INGENIERÍA, UNIVERSIDAD DE LA REPÚBLICA, URUGUAY CONTENIDO Introducción: arquitecturas

Más detalles

Análisis de desempeño y modelo de escalabilidad para SGP

Análisis de desempeño y modelo de escalabilidad para SGP Análisis de desempeño y modelo de escalabilidad para SGP Este documento es producto de la experiencia de Analítica en pruebas de stress sobre el software SGP. Estas pruebas se realizaron sobre un proceso

Más detalles

CLOUD AND SKY COMPUTING

CLOUD AND SKY COMPUTING Universidad Simón Bolívar Sistemas de Operación III (CI-4822) Septiembre Diciembre 2013 CLOUD AND SKY COMPUTING Carlos Gómez Pedro Romero TEMAS Cloud Computing Historia Concepto Características Arquitectura

Más detalles

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011 Clusters Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011 Introducción Aplicaciones que requieren: Grandes capacidades de cómputo: Física de partículas, aerodinámica, genómica, etc. Tradicionalmente

Más detalles

Windows 2000 Server. Manual de Windows 2000 Server

Windows 2000 Server. Manual de Windows 2000 Server Windows 2000 Server Proyecto Huascarán - Ministerio de Educación Dirección de Informática y Telecomunicaciones Área de Informática y Redes Diseño y Elaboración: Carlos A. Anchante Ch. Windows 2000 Server

Más detalles

Un algoritmo genético híbrido para resolver el EternityII. Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau

Un algoritmo genético híbrido para resolver el EternityII. Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau Un algoritmo genético híbrido para resolver el EternityII Rico, Martin; Ros, Rodrigo Directora: Prof. Dra. Irene Loiseau Temas Temas Introducción Eternity II Historia Descripción Demo Metaheurísticas Algoritmos

Más detalles

WHITE PAPER MIGRACIÓN DE UNA APLICACIÓN ON-PREMISE A WINDOWS AZURE. OSSESoluciones - Cartera de Soluciones en Tecnologías de Información

WHITE PAPER MIGRACIÓN DE UNA APLICACIÓN ON-PREMISE A WINDOWS AZURE. OSSESoluciones - Cartera de Soluciones en Tecnologías de Información WHITE PAPER MIGRACIÓN DE UNA APLICACIÓN ON-PREMISE A WINDOWS AZURE OSSESoluciones - Cartera de Soluciones en Tecnologías de Información Sep2014 Contenido Resumen... 3 Acerca de Windows Azure... 4 Caso

Más detalles

Soluciones para entornos HPC

Soluciones para entornos HPC Dr.. IT Manager / Project Leader @ CETA-Ciemat abelfrancisco.paz@ciemat.es V Jornadas de Supercomputación y Avances en Tecnología INDICE 1 2 3 4 HPC Qué? Cómo?..................... Computación (GPGPU,

Más detalles

BIG DATA. Jorge Mercado. Software Quality Engineer

BIG DATA. Jorge Mercado. Software Quality Engineer BIG DATA Jorge Mercado Software Quality Engineer Agenda Big Data - Introducción Big Data - Estructura Big Data - Soluciones Conclusiones Q&A Big Data - Introducción Que es Big Data? Big data es el termino

Más detalles

PROGRAMA FORMATIVO Virtualización, computación en la nube y alta disponibilidad con Oracle Solaris

PROGRAMA FORMATIVO Virtualización, computación en la nube y alta disponibilidad con Oracle Solaris PROGRAMA FORMATIVO Virtualización, computación en la nube y alta disponibilidad con Oracle Solaris Julio 2014 DATOS GENERALES DE LA ESPECIALIDAD 1. Familia Profesional: INFORMÁTICA Y COMUNICACIONES Área

Más detalles

TEMA 2: CAPACIDAD: Diseño del Servicio TI Anexo II: Amazon EC2

TEMA 2: CAPACIDAD: Diseño del Servicio TI Anexo II: Amazon EC2 CIMSI Configuración, Implementación y Mantenimiento de Sistemas Informáticos TEMA 2: CAPACIDAD: Diseño del Servicio TI Anexo II: Amazon EC2 Daniel Cascado Caballero Rosa Yáñez Gómez Mª José Morón Fernández

Más detalles

CA Automation Suite for Hybrid Clouds

CA Automation Suite for Hybrid Clouds HOJA DEL PRODUCTO: For Hybrid Clouds for Hybrid Clouds for Hybrid Clouds está diseñada para aumentar la agilidad y la eficacia, de forma que pueda hacer lo siguiente: Sobrellevar las ráfagas de demanda

Más detalles

MS_20246 Monitoring and Operating a Private Cloud

MS_20246 Monitoring and Operating a Private Cloud Gold Learning Gold Business Intelligence Silver Data Plataform Monitoring and Operating a Private Cloud www.ked.com.mx Por favor no imprimas este documento si no es necesario. Introducción. Este curso

Más detalles

GESTIÓN DE CAPACIDAD DE SERVICIOS TI: UNA SOLUCIÓN DESDE ITIL

GESTIÓN DE CAPACIDAD DE SERVICIOS TI: UNA SOLUCIÓN DESDE ITIL GESTIÓN DE CAPACIDAD DE SERVICIOS TI: UNA SOLUCIÓN DESDE ITIL Consultor Senior de Calidad SW Métodos y Tecnología Responsable de Área Ingeniería y Calidad SW Métodos y Tecnología 1 Palabras clave ITIL,

Más detalles

Mejores prácticas para el éxito de un sistema de información. Uno de los problemas de información dentro de las empresas es contar con datos

Mejores prácticas para el éxito de un sistema de información. Uno de los problemas de información dentro de las empresas es contar con datos ANEXO VI. Mejores prácticas para el éxito de un sistema de información Uno de los problemas de información dentro de las empresas es contar con datos importantes del negocio y que éstos estén aislados

Más detalles

CLUSTER FING: ARQUITECTURA Y APLICACIONES

CLUSTER FING: ARQUITECTURA Y APLICACIONES CLUSTER FING: ARQUITECTURA Y APLICACIONES SERGIO NESMACHNOW Centro de Cálculo, Instituto de Computación FACULTAD DE INGENIERÍA, UNIVERSIDAD DE LA REPÚBLICA, URUGUAY CONTENIDO Introducción Clusters Cluster

Más detalles

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio?

Big Data en la nube. Use los datos. Obtenga información. La pregunta clave es: Qué puede hacer Doopex por mi negocio? Qué es Doopex? Big Data en la nube. Use los datos. Obtenga información. Seguramente, la pregunta clave no es Qué es Doopex?. La pregunta clave es: Qué puede hacer Doopex por mi negocio? El objetivo de

Más detalles

CLOUD COMPUTING: DE LA VIRTUALIZACIÓN DE APLICACIONES Y DE ESCRITORIO, A LA VIRTUALIZACIÓN DE SERVIDORES.

CLOUD COMPUTING: DE LA VIRTUALIZACIÓN DE APLICACIONES Y DE ESCRITORIO, A LA VIRTUALIZACIÓN DE SERVIDORES. CLOUD COMPUTING: DE LA VIRTUALIZACIÓN DE APLICACIONES Y DE ESCRITORIO, A LA VIRTUALIZACIÓN DE SERVIDORES. Ing. Edgar Gutiérrez a, M.C. José Ruiz a, Dr. Diego Uribe a, Dra. Elisa Urquizo a, Dr. Enrique

Más detalles

III. INTRODUCCIÓN AL CLOUD COMPUTING

III. INTRODUCCIÓN AL CLOUD COMPUTING III. INTRODUCCIÓN AL CLOUD COMPUTING Definición (I) Qué es el cloud computing? Nuevo paradigma de computación distribuida Provee un servicio de acceso a recursos computacionales: servidores, almacenamiento,

Más detalles

En las estructuras de datos, muchas de las implementaciones o mapeos de problemas, sus

En las estructuras de datos, muchas de las implementaciones o mapeos de problemas, sus 1 Introducción. En las estructuras de datos, muchas de las implementaciones o mapeos de problemas, sus soluciones o procesos, se basan en matrices binarias. Existen varios métodos y algoritmos que trabajan

Más detalles

Escogiendo un sistema host

Escogiendo un sistema host 2002 Emerson Process Management. Todos los derechos reservados. Vea este y otros cursos en línea en www.plantwebuniversity.com. Fieldbus 402 Escogiendo un sistema host Generalidades Experiencia del proveedor

Más detalles

PRESENTACIÓN PRODUCTO. Más que un software, el método más eficaz de conciliar.

PRESENTACIÓN PRODUCTO. Más que un software, el método más eficaz de conciliar. PRESENTACIÓN PRODUCTO Más que un software, el método más eficaz de conciliar. Automatizar las conciliaciones significa ahorrar recursos y generar mayor rentabilidad en su negocio. Eligiendo Conciliac su

Más detalles

Electrónica Digital II

Electrónica Digital II Electrónica Digital II M. C. Felipe Santiago Espinosa Aplicaciones de los FPLDs Octubre / 2014 Aplicaciones de los FPLDs Los primeros FPLDs se usaron para hacer partes de diseños que no correspondían a

Más detalles

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI)

Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) Centro de Investigación y Desarrollo en Ingeniería en Sistemas de Información (CIDISI) OFERTAS TECNOLÓGICAS 1) GESTIÓN ORGANIZACIONAL Y LOGÍSTICA INTEGRADA: TÉCNICAS Y SISTEMAS DE INFORMACIÓN 2) GESTIÓN

Más detalles

Programación híbrida en arquitecturas cluster de multicore. Escalabilidad y comparación con memoria compartida y pasaje de mensajes.

Programación híbrida en arquitecturas cluster de multicore. Escalabilidad y comparación con memoria compartida y pasaje de mensajes. Programación híbrida en arquitecturas cluster de multicore. Escalabilidad y comparación con memoria compartida y pasaje de mensajes. Fabiana Leibovich, Armando De Giusti, Marcelo Naiouf, Laura De Giusti,

Más detalles

MS_20416 Implementing Desktop Application Environments

MS_20416 Implementing Desktop Application Environments Implementing Desktop Application Environments www.ked.com.mx Av. Revolución No. 374 Col. San Pedro de los Pinos, C.P. 03800, México, D.F. Tel/Fax: 52785560 Introducción En este curso ayuda a construir

Más detalles

Propuesta Matriz de Actividades para un Ciclo de Vida de Explotación de Datos

Propuesta Matriz de Actividades para un Ciclo de Vida de Explotación de Datos Propuesta Matriz de Actividades para un Ciclo de Vida de Explotación de Datos Britos, P. 1,2 ; Fernández, E. 2,1 ; García Martínez, R 1,2 1 Centro de Ingeniería del Software e Ingeniería del Conocimiento.

Más detalles

EVALUACIÓN COMPARADA DEL RENDIMIENTO DEL PROCESADOR INTEL 5570 (NEHALEM)

EVALUACIÓN COMPARADA DEL RENDIMIENTO DEL PROCESADOR INTEL 5570 (NEHALEM) EVALUACIÓN COMPARADA DEL RENDIMIENTO DEL PROCESADOR INTEL 5570 (NEHALEM) Carlos Bernal, Ana Silva, Marceliano Marrón, Juan Antonio Ortega, Claudio J. Arjona Área de HPC Centro Informático Científico de

Más detalles

BOLETÍN DE NOVEDADES Barcelona, junio de 2008

BOLETÍN DE NOVEDADES Barcelona, junio de 2008 BOLETÍN DE NOVEDADES Barcelona, junio de 2008 Introducción El objeto de este documento es presentar y describir brevemente las principales actuaciones en los últimos meses de Carver en algunos de sus clientes,

Más detalles

de qué manera se puede administrar la complejidad de los datos y mejorar la agilidad del negocio?

de qué manera se puede administrar la complejidad de los datos y mejorar la agilidad del negocio? RESUMEN DE LA SOLUCIÓN CA ERwin Modeling de qué manera se puede administrar la complejidad de los datos y mejorar la agilidad del negocio? agility made possible CA ERwin Modeling ofrece un entorno de modelado

Más detalles

Capítulo IV. Implementación del Sistema

Capítulo IV. Implementación del Sistema La implementación del sistema consiste en la integración de la aplicación en una LAN, la instalación en varias computadoras personales de clientes del almacén, de administradores de almacén y de los almacenes

Más detalles

Procesos. Bibliografía. Threads y procesos. Definiciones

Procesos. Bibliografía. Threads y procesos. Definiciones Procesos Prof. Mariela Curiel Bibliografía A. Tanembaum & M. Van Steen. Sistemas Distribuidos. Principios y Paradigmas. 2da. Edición. Smith & Nair. The Architecture of Virtual Machines. IEEE Computer.

Más detalles

Capítulo 1: Marco teórico

Capítulo 1: Marco teórico Capítulo 1: Marco teórico Área de Soporte Técnico Dentro de Oracle, como en cualquier compañía de software existe el área de Soporte Técnico, cuyo objetivo principal es el de brindar asistencia y proveer

Más detalles

BPM: Articulando Estrategia, Procesos y Tecnología

BPM: Articulando Estrategia, Procesos y Tecnología BPM: Articulando Estrategia, Procesos y Tecnología Resumen: La competitividad es el imaginario que dirige las acciones empresariales en la actualidad. Lograr condiciones que permitan competir con mayores

Más detalles

Infraestructura Tecnológica

Infraestructura Tecnológica Infraestructura Tecnológica 1 Sesión No. 12 Nombre: Niveles de confiabilidad Contextualización La confianza es un factor determinante y muy importante, con ésta se pueden dar o rechazar peticiones de negocio,

Más detalles

Gestión automatizada de la infraestructura (IaaS Infraestructure as a Service)

Gestión automatizada de la infraestructura (IaaS Infraestructure as a Service) Universidad de Extremadura (Observatorio Tecnológico HP) Escuela Politécnica de Cáceres Gestión automatizada de la infraestructura (IaaS Infraestructure as a Service) Autores: Emilio José Muñoz Fernández

Más detalles

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS

FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS FaceFinder MÓDULO DE BÚSQUEDA DE PERSONAS DENTRO DE UNA BASE DE DATOS DE ROSTROS Introducción Los algoritmos utilizados para el procesamiento de imágenes son de complejidad computacional alta. Por esto

Más detalles

Conclusiones. Particionado Consciente de los Datos

Conclusiones. Particionado Consciente de los Datos Capítulo 6 Conclusiones Una de las principales conclusiones que se extraen de esta tesis es que para que un algoritmo de ordenación sea el más rápido para cualquier conjunto de datos a ordenar, debe ser

Más detalles

SOLUCIÓN SITUACIÓN ACTUAL

SOLUCIÓN SITUACIÓN ACTUAL SITUACIÓN ACTUAL La necesidad de las organizaciones de ser más competitivas en un mercado dinámico ha generado estructuras organizacionales complejas y exigentes en términos de calidad y eficiencia. Sobre

Más detalles

INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer

INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer INTRODUCCIÓN A LA COMPUTACION EN LA NUBE Y BIG DATA (1) Ing. Carlos Ormella Meyer En los últimos años, el interés por la Computación en la Nube (Cloud Computing), tanto para uso personal como para negocios,

Más detalles

Herramienta para la construcción de un cluster y la distribución de carga entre los nodos

Herramienta para la construcción de un cluster y la distribución de carga entre los nodos Herramienta para la construcción de un cluster y la distribución de carga entre los nodos Rubén A. González García 1, Gabriel Gerónimo Castillo 2 1 Universidad Juárez Autónoma de Tabasco, Av. Universidad

Más detalles

FUNDAMENTOS DE COMPUTACIÓN PARA CIENTÍFICOS. CNCA Abril 2013

FUNDAMENTOS DE COMPUTACIÓN PARA CIENTÍFICOS. CNCA Abril 2013 FUNDAMENTOS DE COMPUTACIÓN PARA CIENTÍFICOS CNCA Abril 2013 6. COMPUTACIÓN DE ALTO RENDIMIENTO Ricardo Román DEFINICIÓN High Performance Computing - Computación de Alto Rendimiento Técnicas, investigación

Más detalles

PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE

PRUEBAS DE SOFTWARE TECNICAS DE PRUEBA DE SOFTWARE PRUEBAS DE SOFTWARE La prueba del software es un elemento crítico para la garantía de la calidad del software. El objetivo de la etapa de pruebas es garantizar la calidad del producto desarrollado. Además,

Más detalles

[Webcast] Servicios de Cómputo en Azure. Implementación Avanzada de Cómputo en la Nube [Web App, Cloud Service y Virtual Machines]

[Webcast] Servicios de Cómputo en Azure. Implementación Avanzada de Cómputo en la Nube [Web App, Cloud Service y Virtual Machines] [Webcast] Servicios de Cómputo en Azure Implementación Avanzada de Cómputo en la Nube [Web App, Cloud Service y Virtual Machines] [Webcast] Servicios de Cómputo en Azure Implementación Avanzada de Cómputo

Más detalles

Planificación y Control de Proyectos de Software mediante MS Project

Planificación y Control de Proyectos de Software mediante MS Project Práctica 2 Planificación y Control de Proyectos de Software mediante MS Project E n esta práctica vamos a introducirnos en la Planificación y Control de Proyectos de Software mediante herramientas informáticas

Más detalles

CAPÍTULO 4 ANÁLISIS Y DISEÑO: e-commerce CONSTRUCTOR

CAPÍTULO 4 ANÁLISIS Y DISEÑO: e-commerce CONSTRUCTOR CAPÍTULO 4 ANÁLISIS Y DISEÑO: e-commerce CONSTRUCTOR En este capítulo se describe el análisis y diseño de un sistema, denominado e-commerce Constructor, el cual cumple con los siguientes objetivos: Fungir

Más detalles

Computación Tercer Año

Computación Tercer Año Colegio Bosque Del Plata Computación Tercer Año UNIDAD 3 Sistemas Operativos E-mail: garcia.fernando.j@gmail.com Profesor: Fernando J. Garcia Ingeniero en Sistemas de Información Sistemas Operativos Generaciones

Más detalles

Solución para tus planes de contingencia y continuidad de negocio

Solución para tus planes de contingencia y continuidad de negocio Solución para tus planes de contingencia y continuidad de negocio Copias de seguridad remotas vía Internet de grandes volúmenes de información ε-indi backup remoto es un software multiplataforma de alto

Más detalles

RAID. Los detalles de las características segunda y tercera, cambian según los distintos niveles RAID. RAID 0 no soporta la tercera característica.

RAID. Los detalles de las características segunda y tercera, cambian según los distintos niveles RAID. RAID 0 no soporta la tercera característica. RAID Como se dijo anteriormente, el ritmo de mejora de prestaciones en memoria secundaria ha sido considerablemente menor que en procesadores y en memoria principal. Esta desigualdad ha hecho, quizás,

Más detalles

PROGRAMA FORMATIVO MACROMEDIA STUDIO 8

PROGRAMA FORMATIVO MACROMEDIA STUDIO 8 PROGRAMA FORMATIVO MACROMEDIA STUDIO 8 www.bmformacion.es info@bmformacion.es Objetivos Se estudia la suite Macromedia Studio 8, que está formada por un conjunto de aplicaciones utilizadas por diseñadores

Más detalles

Alumno: Jorge Sordo Balbín Profesor: Luis Joyanes Aguilar Nº Expediente: 126013 Correo Electrónico: jorge_sordo@hotmail.com

Alumno: Jorge Sordo Balbín Profesor: Luis Joyanes Aguilar Nº Expediente: 126013 Correo Electrónico: jorge_sordo@hotmail.com UNIVERSIDAD PONTIFICIA DE SALAMANCA CAMPUS MADRID INGENIERÍA DE ORGANIZACIÓN INDUSTRIAL TRABAJO ACADÉMICO I Modelos de despliegue y Modelos de servicio Noviembre 2012 Alumno: Jorge Sordo Balbín Profesor:

Más detalles

Procesador Pentium II 450 MHz Procesador Pentium II 400 MHz Procesador Pentium II 350 MHz Procesador Pentium II 333 MHz Procesador Pentium II 300 MHz

Procesador Pentium II 450 MHz Procesador Pentium II 400 MHz Procesador Pentium II 350 MHz Procesador Pentium II 333 MHz Procesador Pentium II 300 MHz PENTIUM El procesador Pentium es un miembro de la familia Intel de procesadores de propósito general de 32 bits. Al igual que los miembros de esta familia, el 386 y el 486, su rango de direcciones es de

Más detalles

Arquitectura para análisis de información. Zombi es una arquitectura que proporciona de manera integrada los componentes

Arquitectura para análisis de información. Zombi es una arquitectura que proporciona de manera integrada los componentes Capítulo 4 Arquitectura para análisis de información propuesta 4.1 Arquitectura Zombi es una arquitectura que proporciona de manera integrada los componentes necesarios para el análisis de información

Más detalles

Diplomado en Big Data

Diplomado en Big Data 160 horas Diplomado en Big Data BROCHURE, 2015 Contenido Quienes somos?... 3 Presentación del Programa... 4 Perfíl del Facilitador. 5 Objetivos.. 6 Información General.. 7 Plan de Estudio... 8-9 Plan de

Más detalles

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS

ESCUELA SUPERIOR DE INFORMATICA Prácticas de Estadística UNA SESIÓN EN SPSS UNA SESIÓN EN SPSS INTRODUCCIÓN. SPSS (Statistical Product and Service Solutions) es un paquete estadístico orientado, en principio, al ámbito de aplicación de las Ciencias sociales, es uno de las herramientas

Más detalles

Plataformas Tecnológicas y Requerimientos Técnicos de las Aplicaciones de

Plataformas Tecnológicas y Requerimientos Técnicos de las Aplicaciones de Plataformas Tecnológicas y Requerimientos Técnicos de las Aplicaciones de Departamento de Sistemas 2014 Página 1 INDICE Introducción 3 Requisitos Generales del Entorno 3 Requisitos Generales de las Aplicaciones

Más detalles

Dirigido a: Objetivos: Alcance: Temario:

Dirigido a: Objetivos: Alcance: Temario: Dirigido a: Este curso está dirigido a personas que han utilizado Excel para tareas muy elementales y que todo lo que han aprendido ha sido de forma empírica. Algunos usuarios con nivel intermedio valoran

Más detalles

No se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos.

No se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos. RAIDS MODO LINEAL Es un tipo de raid que muestra lógicamente un disco pero se compone de 2 o más discos. Solamente llena el disco 0 y cuando este está lleno sigue con el disco 1 y así sucesivamente. Este

Más detalles

Proyecto: Análisis de Protocolo de Red de FPS QuakeIII.

Proyecto: Análisis de Protocolo de Red de FPS QuakeIII. Proyecto: Análisis de Protocolo de Red de FPS QuakeIII. Vicente Inostroza Patricio Navarrete Eduardo Latorre Universidad Técnica Federico Santa María Redes de Computadores Agustín J. González V. July 28,

Más detalles

Ficha Técnica del curso Online de Cloud Computing con Amazon Web Services (AWS)

Ficha Técnica del curso Online de Cloud Computing con Amazon Web Services (AWS) Ficha Técnica del curso Online de Cloud Computing con Amazon Web Services (AWS) Nombre del Curso: Curso Online de Cloud Computing con Amazon Web Services (AWS) Breve descripción del Curso: Este curso online

Más detalles