Informe Técnico CESGA
|
|
- Benito Pérez Carrasco
- hace 7 años
- Vistas:
Transcripción
1 Informe Técnico CESGA Benchmarks para el análisis de nuevas arquitecturas: Xeon Single, Dual y Quadcore J.Carlos Mouriño, Aurelio Rodríguez CESGA. Centro de Supercomputación de Galicia e mail: aplicacions@cesga.es Resumen: En este documento se resumen los resultados de una serie de benchmarks sintéticos y de aplicaciones reales ejecutados en las nuevas arquitecturas multicore de intel presentes en los servidores del CESGA. Palabras Clave: Benchmarks, Arquitectura Multicore, Rendimiento. Este trabajo ha sido cofinanciado por el FSE (Fondo Social Eur opeo)
2 Identificador documento: Fecha: Autores: Responsable: DOC_APL_ Benchmarks Multicore _V0 10/04/07 José Carlos Mouriño Gallego, Manuel Aurelio Rodríguez López Andrés Gómez Status: Historia de Revisiones Versión Autor Descripción 0 Aurelio Desarrollo Informe Técnico Rodríguez Interno 2 / 27
3 Tabla de contenidos 1 Introducción Benchmarks Sintéticos HPC Challenge Benchmark ( 2.2 Linpack de Intel SparseBench ( 3 No sintéticos Montecarlo Gaussian GROMACS AMBER Resultados Linpack de Intel HPCC SparserBench Monte Carlo Gaussian Test 1: Test 2: Test 3: Prefetch por hardware: Test 4: Gromacs y Amber Resumen de resultados Interno 3 / 27
4 1 Intr oducción El benchmarking es una técnica utilizada para medir el rendimiento de un sistema o componente de un sistema, generalmente para ser comparado con algún parámetro de referencia. En el ámbito de la informática, puede entenderse un benchmark como el resultado de la ejecución de un programa o un conjunto de programas en una máquina, con el objetivo de estimar el rendimiento de un componente concreto o la totalidad de la misma, y poder comparar los resultados con otras máquinas. Originalmente, el benchmarking consistía en estimar el tiempo de ejecución de un programa (medido en FLOPs). Pero actualmente con la existente variedad de arquitecturas y compiladores, este único parámetro resulta insuficiente para una comparación real. Existen básicamente dos tipos de benchmarks: bintéticos y no sintéticos (aplicaciones). Los sintéticos suelen estar diseñados para medir el rendimiento de un componente individual de un ordenador, normalmente llevando el componente escogido a su máxima capacidad. Los no sintéticos están basados en aplicaciones reales, y simulan una carga de trabajo para medir el comportamiento global del equipo. Con la idea de evaluar las nuevas arquitecturas / procesadores existentes en el mercado, y así asesorar en futuras incorporaciones de equipos por parte del CESGA, se escogerá un conjunto benchmarks, tanto sintéticos como no sintéticos, cuyas características describiremos a continuación. Interno 4 / 27
5 2 Benchmar ks Sintéticos Con la idea de medir el rendimiento individual de distintos parámetros de cada maquina, se han escogido diferentes benchmarks, cada uno de ellos ideado para medir una característica concreta. 2.1 HPC Challenge Benchmark Se compone básicamente de 7 tests 1 : HPL: Es el benchmark Linpack TPP que mide la capacidad de ejecución en punto flotante resolviendo un sistema de ecuaciones lineales. DGEMM: Mide la capacidad de ejecución en punto flotante de una multiplicación de matrices en doble precisión. STREAM: Sencillo benchmark que mide el ancho de banda sostenido de memoria y la correspondiente capacidad de ejecución para un simple vector. PTRANS (transposición paralela de una matriz): Mide la capacidad de comunicación simultánea entre pares de procesadores. Es también útil para evaluar la capacidad total de comunicaciones que tiene la red. RandomAccess: Mide el rendimiento de los accesos aleatorios a memoria (GUPS). FFT: Mide la capacidad de ejecución en punto flotante de la Transformada de Fourier Discreta (DFT) en una dimensión con números complejos en doble precisión. Communication bandwith and latency: conjunto de tests que miden la latencia y el ancho de banda de un conjunto de patrones de comunicación simultáneos. 2.2 Linpack de Intel Este Benchmark es el test Linpack del paquete anterior pero preparado y compilado por Intel para sus procesadores Xeon, tanto a 32 como a 64 bits SparseBench Este benchmark esta compuesto por un conjunto de tests de métodos iterativos sobre datos sparse 3. Las matrices sparse constituyen un problema importante en el campo del análisis numérico. Al contrario que en el caso de las matrices densas, su manejo no conlleva reaprovechamiento de datos. Por lo tanto, los algoritmos para matrices sparse dependerán más de la velocidad de memoria, que de la velocidad del procesador. Este benchmark utiliza métodos iterativos comunes, preconditioners y distintos esquemas de almacenamiento para evaluar el rendimiento de la máquina con operaciones típicas sobre datos sparse. Concretamente se compone de: Métodos iterativos GMRES y Conjugate Gradient na/eng/ htm1 3 Interno 5 / 27
6 Jacobi and ILU preconditioners. Diagonal storage and compressed row storage matrices. 3 No sintéticos Los benchmarks vistos hasta ahora, y los benchmarks sintéticos en general, están ideados para medir el rendimiento de un componente de manera individual, y suelen estar diseñados para extraer el máximo rendimiento de ese componente. Pero las conclusiones que se puedan extraer no siempre se cumplen a la hora de ejecutar aplicaciones reales, que ejecutan un sinfín de distintas operaciones sobre conjuntos muy variados y heterogéneos de datos. Es más no todas las máquinas obtienen mejores resultados con las mismas aplicaciones. Es por ello que se ha escogido un conjunto de aplicaciones representativas para el CESGA, midiendo el tiempo de ejecución de cada una de ellas sobre las distintas arquitecturas y/o procesadores. 3.1 Montecarlo El método Montecarlo es un método numérico que permite resolver problemas físicos y matemáticos mediante la simulación de variables aleatorias. Su importancia se basa en la existencia de problemas que tienen difícil solución por métodos exclusivamente analíticos o numéricos, pero que dependen de factores aleatorios o se pueden asociar a un modelo probabilística artificial. Gracias al avance de los ordenadores, cálculos Montecarlo que en otro tiempo hubieran sido inconcebibles, hoy en día se presentan como asequibles para la resolución de ciertos problemas. En estos métodos el error depende del número de pruebas, por lo que para ganar una cifra decimal en la precisión, el número de pruebas debe elevarse exponencialmente. Sus aplicaciones actuales se extienden a campos científicos y técnicos tan variados como son los de la Física estadística, biología molecular, genética, redes de información, telecomunicaciones o finanzas. Muchas de las aplicaciones desarrolladas recientemente por los usuarios del CESGA utilizan esta técnica, por lo que es fundamental medir el rendimiento de un método de este tipo. El código elegido para este benchmark está desarrollado por el usuario Manuel Martínez, de la Universidad de Vigo, que aplica el método a cadenas moleculares con el fin de calcular propiedades derivadas de hidrocarburos de alta presión. Este código ha sido revisado y optimizado por los técnicos del CESGA, y creemos que es suficientemente representativo para este tipo de aplicaciones. Interno 6 / 27
7 3.2 Gaussian 03 Gaussian 03 es una de las aplicaciones más utilizadas en el CESGA. Este paquete de programas permite el cálculo de propiedades (energías, frecuencias de vibración, geometría óptima, etc.) de moléculas e intermedios de reacción, fundamentalmente mediante métodos ab initio aunque también incorpora métodos semiempíricos 4. Se han elegido 4 casos que intentan abarcar los distintos requisitos computacionales demandados por los distintos algoritmos involucrados en la ejecución: 1) test139 48Mb RAM 26Mb disk: test número 139 de Gaussian 03, este test presenta una baja demanda de memoria y disco. 2) incore 665Mb RAM: test número 23 de Gaussian 03 modificado para el cálculo incore con un uso de 665Mb de RAM y baja demanda de disco. 3) 512Mb RAM 1.5Gb: Cálculo de Coupled Clusters semiconvencional con requerimientos de 512Mb de RAM y 1.5Gb de disco. 4) Parallel: a. Cálculo de optimización MP2 con requerimientos de 1700Mb de RAM y baja demanda de disco. b. Cálculo de optimización DFT con requerimientos de 1700Mb de RAM y baja demanda de disco. c. Cálculo paralelo DFT incore con requerimientos de 1700Mb de RAM. 4 Gaussian 03, Revision C.03, M. J. Frisch, G. W. Trucks, H. B. Schlegel, G. E. Scuseria, M. A. Robb, J. R. Cheeseman, J. A. Montgomery, Jr., T. Vreven, K. N. Kudin, J. C. Burant, J. M. Millam, S. S. Iyengar, J. Tomasi, V. Barone, B. Mennucci, M. Cossi, G. Scalmani, N. Rega, G. A. Petersson, H. Nakatsuji, M. Hada, M. Ehara, K. Toyota, R. Fukuda, J. Hasegawa, M. Ishida, T. Nakajima, Y. Honda, O. Kitao, H. Nakai, M. Klene, X. Li, J. E. Knox, H. P. Hratchian, J. B. Cross, V. Bakken, C. Adamo, J. Jaramillo, R. Gomperts, R. E. Stratmann, O. Yazyev, A. J. Austin, R. Cammi, C. Pomelli, J. W. Ochterski, P. Y. Ayala, K. Morokuma, G. A. Voth, P. Salvador, J. J. Dannenberg, V. G. Zakrzewski, S. Dapprich, A. D. Daniels, M. C. Strain, O. Farkas, D. K. Malick, A. D. Rabuck, K. Raghavachari, J. B. Foresman, J. V. Ortiz, Q. Cui, A. G. Baboul, S. Clifford, J. Cioslowski, B. B. Stefanov, G. Liu, A. Liashenko, P. Piskorz, I. Komaromi, R. L. Martin, D. J. Fox, T. Keith, M. A. Al Laham, C. Y. Peng, A. Nanayakkara, M. Challacombe, P. M. W. Gill, B. Johnson, W. Chen, M. W. Wong, C. Gonzalez, and J. A. Pople, Gaussian, Inc., Wallingford CT, Interno 7 / 27
8 Para los 3 primeros tests se medirán tiempos ejecutando 1,2,4 y hasta 8 copias simultáneas en el caso del procesador quadcore concurrentemente. De esta manera se intenta medir la capacidad de throughtput en la arquitectura concreta para esta aplicación. A su vez estos tres primeros casos se ejecutarán con las siguientes opciones de la BIOS deshabilitadas relacionadas con la optimización del rendimiento mediante técnicas de prefetch por hardware en el nodo quadcore 5 : Hardware Prefetcher (Data Prefetch Logic) Adjacent Cache Line (L2 Streaming Prefetch) El 4º test (caso a y b) se ejecutará demandando 1,2 y 4 procesadores mediante ejecución paralela de la implementación de memoria compartida (OpenMP) de Gaussian 03. Con este test se pretende probar el escalado paralelo del algoritmo concreto dentro de esta aplicación para cada arquitectura. El caso c, centrado únicamente en el quadcore, pretende medir la capacidad de throughtput con aplicaciones paralelas y se ejecutará concurrentemente varios procesos demandando diferente número de hilos. 3.3 GROMACS GROMACS es un software versátil para cálculos de dinámica molecular, es decir, simular las ecuaciones de Newton del movimiento para sistemas de cientos a millones de partículas. 6 Se ejecutará en paralelo usando la versión compilada con OpenMPI el benchmark DPPC de la aplicación 7. Con este test se pretende probar el escalado paralelo del algoritmo concreto dentro de esta aplicación para cada arquitectura. 5 na/eng/dc/xeon/ htm?page=2 6 Versión Interno 8 / 27
9 DPPC A phospholipid membrane, a total of 121,856 atoms. 3.4 AMBER AMBER es un conjunto de programas que permiten al usuario realizar simulaciones de dinámica molecular, fundamentalmente en biomoléculas, basadas en teorías de campos de fuerza 8. Se ejecutarán en serie los benchmarks estandar de AMBER Esta ejecución complementa al test con GROMACS probando los algoritmos involucrados en programas de modelización molecular clásica Interno 9 / 27
10 4 Resultados Se han elegido 4 procesadores Xeon diferentes presentes en el CESGA para ser evaluados mediante estos Benchmarks: Nodo Eimrt: contiene 2 procesadores Intel Xeon a 3.60GHz con 2048KB de caché, 4Gb de RAM y SO 32bits CentOS release 4.3 (Final) con kernel Nodo DualCore: 2 procesadores duales Intel Xeon 5160 a 3.00GHz con 4096KB de caché, 4Gb de RAM y SO 32bits Scientific Linux Release con kernel Nodo QuadCore: 2 procesadores QuadCore Intel Xeon E5310 a 1.6 GHz con 4096KB de caché, 4Gb y 8Gb de RAM y SO 64bits Scientific Linux SL release 4.4 (Beryllium) con kernel Nodo QuadCore2: 2 procesadores QuadCore Intel Xeon X5355 a 2.66GHz con 409 KB de caché, 8Gb de RAM y SO 64bits Scientific Linux SL release 4.4 (Beryllium) con kernel Nodo Eimrt Nodo DualCore Nodo QuadCore Nodo QuadCore2 Frecuencia/Relación Nº cores cache RAM disco SO 3.60GHz / KB 4Gb SCSI 32bits 3.00GHz / KB 4Gb SATA 32bits 1.60GHz / KB 4Gb/8Gb SCSI 64bits 2.66 GHz / KB 8Gb SCSI 64bits Para todos los tests sintéticos, excepto el de Intel que viene precompilado se ha utilizado el compilador de Intel v. 9.1, con las mejores opciones de compilación encontradas para cada caso. En todas las tablas y gráficas aparte de las medidas sin modificar aparece un dato extra en azul en el caso de las tablas y una gráfica extra en el caso de las graficas donde se expresan los resultados normalizados y considerando la relación de frecuencia presente entre los distintos cores. 4.1 Linpack de Intel En la siguiente tabla se muestran los resultados en GFLOPS de ejecutar el test Linpack precompilado por Intel para cada uno de sus procesadores. Entre paréntesis se indica en miles el tamaño máximo de datos con el que se ha podido ejecutar el test. Puede observarse que este tamaño es de (unos 4Gb de memoria) en el caso de 64 bits y de (unos 2 Gb de memoria) para el caso de SO de 32 bits. Interno 10 / 27
11 4.2 HPCC Informe Técnico CESGA Fecha: 10/04/2007 QuadCore QuadCore2 DualCore Eimrt /1 (22) 8.55/0.91 (32) 7.17/0.67 (16) 5.73/0.45 (16) /1 (22) 17.48/0.91 (32) 14.15/0.66 (16) 11.05/0.43 (16) /1 (22) 35.77/0.98 (32) 26.51/0.64 (16) /1 (22) 56.66/0.90 (32) Tabla 1. Resultados del test Linpack de Intel Esta suite de test se compone de varios benchmarks individuales. Presentamos el HPL por separado y después una tabla comparativa del resto de los tests. QuadCore QuadCore2 DualCore Eimrt /1 (8) 5.92/0.93 (22) 7.09/0.98 (13) 5.68/0.65 (15) /1 (11) 11.75/0.93 (29) 13.81/0.97 (17) 10.82/0.63 (19) /1 (21) 23.94/0.98 (31) 25.24/0.92 (22) /1 (22) 40.73/0.95 (31) Tabla 2. Resultados del test HPL de HPCC En la tabla se muestran de nuevo los resultados del test de linpack, pero en este caso compilado y parametrizado por nosotros. Se han probado distintas compilaciones e infinidades de valores en sus parámetros. Aquí se muestran los resultados que se han conseguido en el mejor de los casos. En el caso de los Procesadores Xeon y Dual, los resultados están muy próximos a los conseguidos con el propio test de Intel, lo que indica la buena elección de opciones de compilación y parámetros que se ha hecho. Sin embargo, en el QuadCore, los resultados obtenidos distan bastante de los conseguidos con el propio test de Intel. Esto puede ser debido principalmente al compilador, ya que la versión que tenemos instalada, no contempla este tipo de procesadores. Se ha compilado utilizando las mismas opciones que si fueran Dual core. Además, mientras que en los otros dos casos se ha compilado en la misma máquina en la que se iba a ejecutar, en este caso no ha sido posible, ya que no se disponía de licencia para estas máquinas. Es interesante comprobar en este caso el tamaño máximo de datos permitido, que parece que crece a medida que se utilizan más cores. No encontramos una respuesta convincente a este fenómeno, por lo que es un caso pendiente de tratar y estudiar. Interno 11 / 27
12 QuadCore QuadCore2 DualCore Eimrt DGEMM (Gflop/s) 5.36/1 6.40/ / /0.49 STREAM (GB/s) PTRANS (GB/s) Latency Random Access (msec) Bandwidth (MB/s) FFT single (Gflop/s) 0.74/1 0.98/ / /0.38 Latency Communications (msec) Bandwidth (MB/s) Tabla 3. Resumen de resultados del test HPCC En esta segunda tabla se muestra un resumen de resultados de los otros benchmarks incluidos en la suite HPCC. Tal y cómo se han medido los tests, estos resultados no tienen una gran relevancia, ya que las ejecuciones se han ido ajustando para conseguir un valor máximo en el test HPL, y no en cualquiera de los otros tests. Además estos resultados son los mejores en culquiera de las ejecuciones que se han realizado, no teniendo porque corresponder a la misma ejecución ni a la misma combinación de parámetros. 4.3 SparserBench En la tabla se muestra el rendimiento máximo obtenido en MFLOPs tras la ejecución de este test, y el rendimiento asintótico de diversas operaciones con datos sparse. QuadCore QuadCore2 DualCore Eimrt Highest attained 3777/1 3464/ / /0.36 Diagonal storage Matrix vector 395/1 444/ / /0.42 product Symmetrically stored CRS Matrix 235/1 345/ / /0.44 vectro product CRS Matrix vector product 293/1 457/ /0.42 Diagonal storage ILU solve 267/1 373/ / /0.17 Symmetrically stored CRS ILU solve 209/1 260/ / /0.44 CRS ILU solve 144/1 126/ /0.62 Vector operations in CG 851/1 771/ / /0.32 Diagonal storage Block Jacobi solve 370/1 473/ / /0.32 Tabla 4. Resultados del test SparseBench Interno 12 / 27
13 4.4 Monte Carlo De este código se han hecho dos ejecuciones en cada uno de los procesadores, una con 100 ciclos y otra con 200 ciclos. Como la aplicación no es paralela, sólo se han realizado ejecuciones sobre un único core. Elapsed QuadCore QuadCore2 DualCore Eimrt time/s 100 ciclos 190/1 118/ / / ciclos 381/1 229/ / /0.56 Tabla 5. Resultados del test de Monte Carlo En la tabla se muestran los tiempos de estas ejecuciones en segundos. Puede observarse que una vez más los cores del Dual son los que obtienen un mejor resultado, debido, seguramente a su combinación de frecuencia caché, y los Quad son los que obtienen un peor rendimiento (aunque sería en la máquina que mas casos podríamos ejecutar simultáneamente gracias a su mayor número de cores). Interno 13 / 27
14 4.5 Gaussian Test 1: Este test ejecuta procesos concurrentemente. Se aprecia un pequeño degradado en el rendimiento según aumenta el número de procesos. En el caso del procesador quadcore el degradado es sólo de un 10% en la ejecución de 8 procesos (número de cores presente en el nodo). Si tenemos en cuenta el factor frecuencia el procesador quadcore presenta un apreciable mejor rendimiento según aumenta el número de procesos. Interno 14 / 27
15 4.5.2 Test 2: Este test también ejecuta procesos concurrentemente aunque estos procesos presentan un consumo de memoria RAM elevado. Se aprecia un degradado mucho más importante en el rendimiento según aumenta el número de procesos. En el caso del procesador quadcore el degradado es de un 60% en la ejecución de 8 procesos (número de cores presente en el nodo, este caso ha sido ejecutado en un nodo con 8Gb de RAM). Teniendo en cuenta el factor de frecuencia se observa un rendimiento apreciablemente superior en el procesador quadcore. Interno 15 / 27
16 4.5.3 Test 3: Este test también ejecuta procesos concurrentemente aunque estos procesos presentan un consumo de Disco elevado. Se han realizado 2 ejecuciones, en la primera los procesos son ejecutados concurrentemente mientras que en la segunda se introduce un retraso aleatorio entre 1 y 2 minutos en la ejecución. A su vez esta segunda ejecución se ha probado también en un nodo con 8Gb de RAM. Interno 16 / 27
17 En general se aprecia un degradado muy importante en el rendimiento en cuanto se superan 2 procesos concurrentes. En el caso ejecutado con un retraso el degradado es menos importante aunque aún muy marcado pero especialmente trancendente para el caso del nodo con dualcore probablemente debido al disco SATA de este frente a los SCSI del resto. Cabe destacar la importancia del cache de disco, en el caso de la ejecución en el nodo quadcore con 8Gb de RAM el degradado ha disminuido radicalmente en el caso con 4 procesadores concurrentes. Interno 17 / 27
18 4.5.4 Prefetch por hardware: Informe Técnico CESGA Fecha: 10/04/2007 A continuación en el nodo quadcore se deshabilitó en un caso únicamente la opción de la BIOS Hardware Prefetcher (Data Prefetch Logic) (caso hwp off alcp on) y en otro tanto la opción Hardware Prefetcher (Data Prefetch Logic) como la opción Adjacent Cache Line (L2 Streaming Prefetch) (caso hwp off alcp off) y se procedió a ejecutar los 3 tests anteriores. Los resultados se exponen a continuación: Interno 18 / 27
19 Se aprecia como el Hardware Prefetcher tiene una influencia apreciable en el cálculo. Incrementos de hasta un 10% en el tiempo de ejecución hacen que esta opción sea recomendable en nodos de cálculo utilizados para la ejecución de este tipo de software. Interno 19 / 27
20 4.5.5 Test 4: En los casos a) y b) esta vez no se ejecutan procesos concurrentemente sino que se busca medir el escalado de la paralelización OpenMP presente en el programa. Para ello se han elegido 2 métodos ampliamente usados: MP2 y DFT y se ha diseñado un test con un consumo de memoria de 1700Mb. a) Interno 20 / 27
21 b) Se aprecia un mejor escalado en el procesador quadcore pudiendose llegar a intuir la consecución de un rendimiento similar a los duales según aumenta el número de procesadores. Sería interesante tener una confirmación de esta suposición. A la vez se aprecia un muy pequeño escalado en el nodo eimrt en el paso de 2 a 4 hilos en el cálculo DFT que se puede atribuir al hyperthreading presente en esta arquitectura. Si tenemos en cuenta el factor de frecuencia entre los procesadores se aprecia un rendimiento similar entre el dual y el quadcore. c) En este caso se intenta discernir el modelo de ejecución más óptima que combine menor tiempo de ejecución del proceso y mayor aprovechamiento del nodo quadcore. Interno 21 / 27
22 Para ello se han ejecutado 4 procesos concurrentes que usan 2 hilos para su ejecución y 2 procesos concurrentes que usan 4 hilos en su ejecución. Se aprecia que ambas alternativas, 4 procesos x 2 hilos y 2 procesos x 4 hilos, son adecuadas para la ejecución de estos procesos no presentando una diferencia en degradado excesiva. Por supuesto esta conclusión es altamente dependiente del escalado paralelo del trabajo a ejecutar. Interno 22 / 27
23 4.6 Gromacs y Amber Con estos tests se intenta probar los algoritmos involucrados en modelización molecular clásica. Se han elegido estas aplicaciones por ser ampliamente utilizadas en este campo y por los usuarios del CESGA. En el caso de Gromacs se intenta ver el escalado paralelo de la implementación MPI de Gromacs en las distintas arquitecturas. La ejecución paralela involucra únicamente procesos intranodo. Interno 23 / 27
24 Esta aplicación presenta un buen escalado hasta 8 procesos lo que ha implicado la obtención de un rendimiento similar con el nodo quadcore comparado con el dualcore a pesar de su más baja frecuencia de reloj. A su vez cabe destacar una ganancia significativa en el caso del eimrt al pasar de 2 a 4 procesos que confirma la ventaja del hyperthreading presente en este nodo. A continuación se exponen los tiempos de ejecución de los benchmarks estandar de Amber 8.0 en las distintas arquitecturas. Quadcore Total time/s Quadcore2 Total time/s Dualcore Total time/s Eimrt Total time/s factor_ix 1241/1 831/ / /0.54 gb_cox2 585/1 354/ / /0.46 gb_mb 67/1 41/ / /0.56 hb 561/1 364/ / /0.55 jac 748/1 484/ / /0.56 rt 1792/1 1172/ / /0.55 trx 57/1 37/ / /0.52 Tabla 6. Benchmarks estandar de Amber 8.0 Cabe destacar el similar rendimiento entre el procesador Quadcore y el Eimrt a pesar de enorme diferencia de frecuencia de reloj presente entre los 2 procesadores. Si comparamos teniendo en cuenta el factor de frecuencia el redimiento del quadcore y el dualcore es el mismo. Interno 24 / 27
25 5 Resumen de resultados. A continuación se exponen los resultados normalizados al rendimiento máximo alcanzado entre las distintas arquitecturas: (nótese que de algunos casos no han sido tomados datos por lo el resultado es fijado a cero en las figuras) Interno 25 / 27
26 Resultados de rendimiento normalizados al rendimiento máximo divididos por el factor de frecuencia de reloj: (nótese que de algunos casos no han sido tomados datos por lo el resultado es fijado a cero en las figuras) Interno 26 / 27
27 De estos gráficos se puede apreciar como la arquitectura presente en el QuadCore es la más equilibrada: En el caso de los benchmarks sintéticos un aumento de frecuencia de reloj hace disminuir únicamente el rendimiento en los casos con accesos a memoria dispersos (sparse, FFT). En el caso de los benchmarks de aplicaciones el rendimiento es casi independiente de la frecuencia y las pérdidas de rendimiento en los casos con acceso a disco elevado puede ser atribuible al menor buffer de disco. Interno 27 / 27
Universidad de Los Andes. Facultad de Ciencias Departamentos de Física y de Química
Universidad de Los Andes. Facultad de Ciencias Departamentos de Física y de Química Entendiendo el Concepto de Densidad de Estados (DOS) Pedro Contreras, Luis Seijas, y José Burgos GRINCEF, Mérida, Junio
EVALUACIÓN COMPARADA DEL RENDIMIENTO DEL PROCESADOR INTEL 5570 (NEHALEM)
EVALUACIÓN COMPARADA DEL RENDIMIENTO DEL PROCESADOR INTEL 5570 (NEHALEM) Carlos Bernal, Ana Silva, Marceliano Marrón, Juan Antonio Ortega, Claudio J. Arjona Área de HPC Centro Informático Científico de
Figura 1. Ligando con el sustituyente H, se puede observar la interacción que se lleva a cabo con la Tyr 150, Asn 346 y Ser 389 de la beta-lactamasa.
Metodología computacional Se obtuvo la estructura de las enzimas β- lactamasa de la base de datos Protein Data Bank, la cual tiene asignada la clave 1Y54. Una vez obtenidas las enzimas, se llevará a cabo
Evaluación del rendimiento de procesadores Intel Nehalem. Modelos x7550, x5670 y x5570
Evaluación del rendimiento de procesadores Intel Nehalem. Modelos x7550, x5670 y x5570 Juan Carlos Fernández Rodríguez. Área de HPC. Centro Informático Científico de Andalucía (CICA) Junta de Andalucía
Códigos de Química Computacional en el CESGA (Gaussian, GAMESS, NWCHEM)
Códigos de Química Computacional en el CESGA (Gaussian, GAMESS, NWCHEM) Aurelio Rodríguez, Técnico de Aplicaciones aurelio@cesga.es HARDWARE Componentes básicos Rendimiento de disco y memoria Uso de memoria
Introducción. Erika Natalia Bentz a, Rosana María Lobayan a,b* Nacional del Nordeste, Avda. Libertad 5300, 3400 Corrientes, Argentina.
CONTRIBUCIÓN DIFERENCIAL DE LOS DISTINTOS CONFÓRMEROS DE ISÓMEROS Z DE (4α 6, 2α O 1 )- FENILFLAVANOS SUSTITUIDOS SEGÚN R = H, OH Y OCH 3 Y CORRIMIENTOS QUÍMICOS EN ESPECTROS DE RESONANCIA MAGNÉTICA NUCLEAR
Medición del Rendimiento de Computadores
Arquitectura 08/09 Medición l Rendimiento Motivación: Qué medidas tiempo se utilizan para evaluar el rendimiento? Cómo finimos el tiempo cpu y el rendimiento l procesador? Qué parámetros condicionan el
Capítulo 3. Modelización de las reacciones fotoquímicas
Capítulo 3 Modelización de las reacciones fotoquímicas 35 36 Capítulo 3 3. Modelización de las reacciones fotoquímicas. El objetivo de los métodos teóricos y computacionales, en el estudio de mecanismos
Revista del Centro de Investigación. Universidad La Salle ISSN: Universidad La Salle México
Revista del Centro de Investigación. Universidad La Salle ISSN: 1405-6690 revista.ci@ulsa.mx Universidad La Salle México Buschbeck, Martha; Cuevas, Gabriel Estudio riguroso de la superficie de energía
Cálculo Estructural, Fluídos e Magnetismo Ansys 5.7
1 2 Temas SD SVG SC Cálculo Estructural, Fluídos e Magnetismo Ansys 5.7 X Cálculo Molecular Amber 8.0 X X X Gaussian 98 X X X Gaussian 03 X X X Dalton X X X CPMD X X X GAMESS X X X Molden X X NWCHEM X
Servet: una suite de benchmarks para el soporte del autotuning en clusters de sistemas multinúcleo
1/41 Servet: una suite de benchmarks para el soporte del autotuning en clusters de sistemas multinúcleo Jorge González-Domínguez*, Guillermo L. Taboada, Basilio B. Fraguela, María J. Martín, Juan Touriño
Medición del rendimiento
Medición del rendimiento Medición del rendimiento El rendimiento de la CPU es el tiempo de ejecución. Ecuación del rendimiento de la CPU Tiempo CPU = Ciclos de reloj para el programa x Periodo del reloj
INTRODUCCIÓN Y MEDIDAS DE RENDIMIENTO BENCHMARK
Todos los derechos de propiedad intelectual de esta obra pertenecen en exclusiva a la Universidad Europea de Madrid, S.L.U. Queda terminantemente prohibida la reproducción, puesta a disposición del público
Medición del Rendimiento de Computadores
Arquitectura 09/10 Medición l Rendimiento Motivación: Qué medidas tiempo se utilizan para evaluar el rendimiento? Cómo finimos el tiempo cpu y el rendimiento l procesador? Qué parámetros condicionan el
ANALISIS COMPARATIVO DEL RENDIMIENTO. PUA: Vergara Bruno Benjamín 2011
ANALISIS COMPARATIVO DEL RENDIMIENTO PUA: Vergara Bruno Benjamín 2011 CONTENIDO Introducción Necesidad y Objetivos de la evaluación Técnicas de evaluación de un sistema informático Medidas del rendimiento
CAPÍTULO 14 TÉCNICAS EXPERIMENTALES
Parte Experimental CAPÍTULO 14 TÉCNICAS EXPERIMENTALES Toda la parte experimental de la primera (I) y la segunda parte (II) de este trabajo de tesis doctoral se realizó utilizando los equipos que en su
cuevogenet Paralelización en CUDA de la Dinámica Evolutiva de Redes Génicas Dirigido por: Fernando Díaz del Río José Luis Guisado Lizar
cuevogenet Paralelización en CUDA de la Dinámica Evolutiva de Redes Génicas Realizado por: Raúl García Calvo Dirigido por: Fernando Díaz del Río José Luis Guisado Lizar Objetivos Implementar un algoritmo
CAR. http://acarus.uson.mx/cursos2013/car.htm
CAR http://acarus.uson.mx/cursos2013/car.htm Sistemas de CAR en la UNISON Responsable : María del Carmen Heras Sánchez Asesores Técnicos : Aracely Dzul Campos Daniel Mendoza Camacho Yessica Vidal Quintanar
Linear Algebra PACKage (LAPACK) Avances en la Generación de Bibliotecas de Álgebra Lineal Universidad Politécnica de Valencia Marzo, 2006
Linear Algebra PACKage () Avances en la Generación de Bibliotecas de Álgebra Lineal Universidad Politécnica de Valencia Marzo, 2006 Estructura Qué es la biblioteca? Organización de Funcionalidad de Sistemas
Recibido: 22/08/2013 Aceptado: 06/12/2013
Predicción de las constantes de ionización (pka) de fenoles usando descriptores mecánico cuánticos Prediction of the ionization constant (pka) of phenols using quantum mechanical descriptors Carlos Rivas
Nodos de Cálculo i7/i9. Informática Personal. Servidores para cálculo científico. Clústers de computación. Almacenamiento de Datos.
Informática Personal Servidores para cálculo científico Clústers de computación Almacenamiento de Datos Consumibles Diseño de software a medida Diseño Web www.qhr-ci.com Nodos de Cálculo i7/i9 Debo comprar
FUNDAMENTOS DE COMPUTACION INVESTIGACION PROCESADORES DIANA CARRIÓN DEL VALLE DOCENTE: JOHANNA NAVARRO ESPINOSA TRIMESTRE II
FUNDAMENTOS DE COMPUTACION INVESTIGACION PROCESADORES DIANA CARRIÓN DEL VALLE DOCENTE: JOHANNA NAVARRO ESPINOSA TRIMESTRE II 2013 Características principales de la arquitectura del procesador AMD Phenom
Análisis DFT de las propiedades electrónicas de las hojas de grafeno y de nitruro de boro dopadas
Análisis DFT de las propiedades electrónicas de las hojas de grafeno y de nitruro de boro dopadas Ernesto Chigo Anota Cuerpo Académico de Ingeniería en Materiales,Facultad de Ingeniería Química Benemérita
HPC: Aplicaciones y Software
HPC: Aplicaciones y Software Heredado HPC: Aplicaciones y Software Fernando G. Tinetti III-LIDI, Fac. de Informática, UNLP Comisión de Inv. Científicas, Bs. As. fernando@info.unlp.edu.ar Aplicaciones y
Tutorías con Grupos Reducidos (TGR) Parte 1: Evaluación de prestaciones
Tutorías con Grupos Reducidos (TGR) Parte 1: Evaluación de prestaciones ESTRUCTURA DE COMPUTADORES Grupo de Arquitectura de Computadores (GAC) Dyer Rolán García (GAC) Evaluación de Prestaciones Curso 2011/2012
La química computacional en el salón de clase
didáctica de la química La química computacional en el salón de clase Carlos Amador Bedolla 1 y Carlos Octavio Olvera Bermúdez 1 Abstract (Computational chemistry in the classroom) The increase in general
High Performance Computing y Big Data en AWS. +info: (http://gac.udc.es) HPC y Big Data en AWS 16 Abril, 2012 1 / 14
High Performance Computing y Big Data en AWS +info: (http://gac.udc.es) HPC y Big Data en AWS 16 Abril, 212 1 / 14 High Performance Computing High Performance Computing (HPC) Afonta grandes problemas empresariales,
Ejemplos de aplicaciones con FPGA: Computación de Alta Performance (HPC)
Ejemplos de aplicaciones con FPGA: Computación de Alta Performance (HPC) Javier Haboba jhaboba@bi-fe.com Bife Supercomputing S.A. 1 Resumen Introducción. Ejemplo 1: Monte Carlo. Ejemplo 2: Dinámica Molecular.
Intel lanza su procesador Caballero Medieval habilitado para Inteligencia Artificial
Intel lanza su procesador Caballero Medieval habilitado para Inteligencia Artificial Intel ha lanzado su procesador Xeon Phi en la Conferencia Internacional de Supercomputación de Alemania. El procesador
Multiplicación de Matrices en Sistemas cc-numa Multicore. Autor: Jesús Cámara Moreno Director: Domingo Giménez Cánovas
Multiplicación de Matrices en Sistemas cc-numa Multicore Autor: Jesús Cámara Moreno Director: Domingo Giménez Cánovas Índice de Contenido 1. Introducción 2. Línea de Investigación 3. Sistemas Empleados
ÍNDICE PRACTICA 1. OPTIMIZACIÓN DE LA MOLÉCULA DE AGUA. Práctica 3. REGIÓN DEL HIDRÓGENO: ESPECTRO DE IR DE UN ALCOHOL.
ÍNDICE ANTECEDENTES MANEJO BÁSICO DE GAUSSVIEW 5.08 Menús de GaussView Construcción de moléculas Ejercicios Uso del mouse en GaussView MANEJO BÁSICO DE GAUSSIAN 09 EL ESPECTRO INFRARROJO Y SUS REGIONES
PROPIEDADES ÁCIDO-BÁSICAS DE LA SUPERFICIE DE MgO CON DIFERENTES DEFECTOS SUPERFICIALES
Jornadas SAM 2000 - IV Coloquio Latinoamericano de Fractura y Fatiga, Agosto de 2000, 1087-1092 PROPIEDADES ÁCIDO-BÁSICAS DE LA SUPERFICIE DE MgO CON DIFERENTES DEFECTOS SUPERFICIALES M.M. Branda a/b,
ESTUDIO TEÓRICO DEL ENLACE QUÍMICO EN CÚMULOS DE ALUMINIO Y OXÍGENO
CONAMET/SAMSIMPOSIO MATERIA 2002 ESTUDIO TEÓRICO DEL ENLACE QUÍMICO EN CÚMULOS DE ALUMINIO Y OXÍGENO Ana Martínez 1, Luis E. Sansores 1, Roberto Salcedo 1, Francisco Tenorio 1 y J. V. Ortiz 2 1: Instituto
SISTEMAS DE ALMACENAMIENTO RAID. Gestión de Sistemas informáticos.
SISTEMAS DE ALMACENAMIENTO RAID Gestión de Sistemas informáticos. ESI-UCA ÍNDICE Introducción. Niveles RAID estándar. Niveles RAID Anidados. Niveles RAID Propietarios. Optimización del sistema RAID. Ventajas
Granularidad y latencia
Niveles de paralelismo y latencias de comunicación Niveles de paralelismo. Granularidad o tamaño de grano. Latencia de comunicación. Particionado de los programas. Empaquetado de granos. Planificación
INTRODUCCIÓN Y MEDIDAS DE RENDIMIENTO MEDIDAS DE RENDIMIENTO
Todos los derechos de propiedad intelectual de esta obra pertenecen en exclusiva a la Universidad Europea de Madrid, S.L.U. Queda terminantemente prohibida la reproducción, puesta a disposición del público
1. Necesidades del comprador: COMPUTADOR PERSONAL Y DE OFICINA PROCESADORES, MEMORIAS RAM, ROM, DISCO DURO, CACHÉ, TARJETAS, IMPRESORAS
1. Necesidades del comprador: COMPUTADOR PERSONAL Y DE OFICINA PROCESADORES, MEMORIAS RAM, ROM, DISCO DURO, CACHÉ, TARJETAS, IMPRESORAS 2. CLON O COMPUTADOR DE MARCA? REQUERIMIENTOS: Procesador Memorias
2. CARACTERÍSTICAS MÍNIMAS DEL EQUIPO OBJETO DE LA ADQUISICIÓN
PLIEGO DE PRESCRIPCIONES TÉCNICAS QUE HA DE REGIR LA LICITACIÓN, MEDIANTE PROCEDIMIENTO ABIERTO, PARA EL SUMINISTRO, LA INSTALACIÓN Y LA PUESTA EN MARCHA DE UN CLÚSTER DE COMPUTACIÓN PARA FUNDACIÓN DONOSTIA
Computación de Altas Prestaciones Sin miedo, es más fácil de lo que parece. Alex Ramírez Arquitecturas Heterogeneas Barcelona Supercomputing Centrer
Computación de Altas Prestaciones Sin miedo, es más fácil de lo que parece Alex Ramírez Arquitecturas Heterogeneas Barcelona Supercomputing Centrer Supercomputadores 2 Qué es un supercomputador? Top500
MODULO DE MEMORIA RAM. Ing. Raúl Rojas Reátegui
MODULO DE MEMORIA RAM Ing. Raúl Rojas Reátegui OBJETIVOS Al termino de la sesión el estudiante será capaz de: Describir las principales chips de memoria RAM. Describir las principales de los módulos de
CÓMPUTO DE ALTO RENDIMIENTO EN MEMORIA COMPARTIDA Y PROCESADORES GRÁFICOS
CÓMPUTO DE ALTO RENDIMIENTO EN MEMORIA COMPARTIDA Y PROCESADORES GRÁFICOS Leopoldo N. Gaxiola, Juan J. Tapia Centro de Investigación y Desarrollo de Tecnología Digital Instituto Politécnico Nacional Avenida
Análisis de rendimiento de algoritmos paralelos
Análisis de rendimiento de algoritmos paralelos Joaquín Andrés López Molina josandlopmol@gmail.com Daniel Mauricio Rodríguez Alpizar danielmau231995@hotmail.com Estudiantes de Ingeniería en Computación
Quinta tarea: Existen varias versiones del 80486:
Quinta tarea: Los primeros procesadores utilizados en los PC fueron los procesadores 8088 y 8086. Sus principales diferencias con el 80286 es que el segundo permite multitarea, tenía una velocidad de reloj
Tema 5 Jerarquía de Memoria
Tema 5 Jerarquía de Memoria Grupo ARCOS Estructura de Computadores Grado en Ingeniería Informática Universidad Carlos III de Madrid Contenidos 1. Tipos de memoria 2. Jerarquía de memoria 3. Memoria principal
COMPARACIÓN DE MODELOS DE SINCRONIZACIÓN EN PROGRAMACIÓN PARALELA SOBRE CLUSTER DE MULTICORES
COMPARACIÓN DE MODELOS DE SINCRONIZACIÓN EN PROGRAMACIÓN PARALELA SOBRE CLUSTER DE MULTICORES Autor: A.P.U. Enzo Rucci Director: Ing. Armando E. De Giusti Co-Director: Lic. Franco Chichizola Tesina de
Directora: Dra. Anna Morajko.
Universitat Autònoma de Barcelona Departament d'arquitectura de Computadors i Sistemes Operatius Directora: Dra. Anna Morajko. Claudia Rosas Mendoza 2008 2009 2009 Auge de las aplicaciones científicas
MÉTODO DE DIFERENCIAS FINITAS (FDM)
MÉTODO DE DIFERENCIAS FINITAS (FDM) MÉTODO DE DIFERENCIAS FINITAS (FDM) Cambia ecuaciones diferenciales ecuaciones en diferencias finitas a Relaciona el valor de la variable dependiente en un punto a valores
Basic Linear Algebra Subprograms (BLAS) Avances en la Generación de Bibliotecas de Álgebra Lineal Universidad Politécnica de Valencia Marzo, 2006
Basic Linear Algebra Subprograms () Avances en la Generación de Bibliotecas de Álgebra Lineal Universidad Politécnica de Valencia Marzo, 2006 Índice Qué es la biblioteca? Organización de Funcionalidad
Descripción en VHDL de arquitecturas para implementar el algoritmo CORDIC
Capítulo 5 Simulación y verificación de las descripciones Luego de describir un circuito digital, éste debe ser simulado para verificar y validar su comportamiento. Se realizaron simulaciones para verificar
Antonio Carrillo Ledesma Ismael Herrera Revilla
Universidad Nacional Autónoma de México Instituto de Geofísica Aplicación del Cómputo Paralelo a la Modelación de Sistemas Continuos en Ciencias e Ingeniería Mediante el Método FETI Dual-Primal Presentan:
Práctica 1 - Rendimiento *
Práctica 1 - Rendimiento * Organización del Computador 1 Verano 2014 Subconjunto mínimo de ejercicios recomendado: 1 a 11 Ejercicio 1 Considere tres procesadores distintos P 1, P 2 y P 3 que ejecutan el
Arquitecturas de Altas Prestaciones y Supercomputación
Arquitecturas de Altas Prestaciones y Supercomputación Presentación del itinerario Julio de 2014 Arquitecturas de Altas Prestaciones y Supercomputación Julio de 2014 1 / 15 Agenda Introducción 1 Introducción
CAR. Responsable : María del Carmen Heras Sánchez. Asesores Técnicos : Daniel Mendoza Camacho Yessica Vidal Quintanar.
CAR Responsable : María del Carmen Heras Sánchez Asesores Técnicos : Daniel Mendoza Camacho Yessica Vidal Quintanar http://acarus2.uson.mx Infraestructura de Hardware Software Conexiones remotas http://acarus2.uson.mx
GRADO EN INGENIERÍA DE COMPUTADORES
GRADO EN INGENIERÍA DE COMPUTADORES Tema 1 Departamento Introducción al de paralelismo Automática Prof. Dr. José Antonio de Frutos Redondo Curso 2015-2016 Tema 1: Introducción Necesidad del procesamiento
TEMA 1: EJECUCIÓN PARALELA: FUNDAMENTOS(I)
Grupo de Arquitectura de Computadores, Comunicaciones y Sistemas ARQUITECTURA DE COMPUTADORES II AUTORES: David Expósito Singh Florin Isaila Daniel Higuero Alonso-Mardones Javier García Blas Borja Bergua
2. CARACTERÍSTICAS MÍNIMAS DEL EQUIPO OBJETO DE LA ADQUISICIÓN
PLIEGO DE PRESCRIPCIONES TÉCNICAS QUE HA DE REGIR LA LICITACIÓN, MEDIANTE PROCEDIMIENTO ABIERTO, PARA EL SUMINISTRO, LA INSTALACIÓN Y LA PUESTA EN MARCHA DE UN CLÚSTER DE PROCESADORES XEON Y DISCOS DE
Universidad Nacional Autónoma de México Instituto de Geofísica
Universidad Nacional Autónoma de México Instituto de Geofísica Aplicación del Cómputo Paralelo a la Modelación de Sistemas Continuos en Ciencias e Ingeniería Presentan: Antonio Carrillo Ledesma Ismael
Tema 1:Arquitectura de ordenadores
Tema 1:Arquitectura de ordenadores Conceptos. Unidades de medida. Unidades funcionales. Componentes Procesador Memoria Placa base Periféricos 1 1. Conceptos Esquema conceptual del ordenador Programa Datos
Pruebas aplicaciones base (application based) las ejecuta y las cronometra.
Que es un benchmark? (Comparador de rendimiento) Un benchmark es un conjunto de procedimientos (programas de computación) para evaluar el rendimiento de un ordenador. Hay cuatro categorías generales de
Clústeres y procesamiento en paralelo XE1GNZ J O R G E F BARBOSA J ACOBO F E B R E R O DE 20 17
Clústeres y procesamiento en paralelo XE1GNZ J O R G E F BARBOSA J ACOBO F E B R E R O DE 20 17 Al escuchar la palabra clúster se piensa en grandes maquinas exclusivas de los grandes de la computación
ARQUITECTURA DEL COMPUTADOR
1-11 Marzo de 2017 FACET -UNT ARQUITECTURA DEL COMPUTADOR Graciela Molina gmolina@herrera.unt.edu.ar m.graciela.molina@gmail.com 1 MODELO VON NEUMANN RAM J. Von Neumann frente a la computadora IAS, 1952.
Estructura de Computadores Tema 1. Introducción a los computadores
Estructura de Computadores Tema 1. Introducción a los computadores Departamento de Informática Grupo de Arquitectura de Computadores, Comunicaciones y Sistemas UNIVERSIDAD CARLOS III DE MADRID Contenido
Modelos de computadores paralelos
Modelos de computadores paralelos Domingo Giménez Departamento de Informática y Sistemas Universidad de Murcia, Spain dis.um.es/~domingo Universidad de Murcia 1 Contenido Programación paralela Modelos
TEMA: ALGEBRA LINEAL NUMERICA
Algebra y Geometría 009 TEMA: ALGEBRA LINEAL NUMERICA En todo el trayecto de la cursada se han realizado cálculos numéricos: se resolvieron sistemas de ecuaciones lineales se multiplicaron matrices se
CLUSTER FING: ARQUITECTURA Y APLICACIONES
CLUSTER FING: ARQUITECTURA Y APLICACIONES SERGIO NESMACHNOW Centro de Cálculo, Instituto de Computación FACULTAD DE INGENIERÍA, UNIVERSIDAD DE LA REPÚBLICA, URUGUAY CONTENIDO Introducción Clusters Cluster
Página 1 de 12 CONCEPTOS INFORMÁTICOS BÁSICOS
Página 1 de 12 CONCEPTOS INFORMÁTICOS BÁSICOS CONTENIDOS a. CONCEPTOS INFORMÁTICOS i. Informática ii. Sistema informático iii. Ordenador iv. El sistema binario v. Medidas de almacenamiento de la información
ESTUDIO TEÓRICO DE LA ISOMERIZACIÓN DEL ÁCIDO MALEICO EN ÁCIDO FUMÁRICO: UN ENFOQUE BASADO EN EL CONCEPTO DE SUPERFICIE DE ENERGÍA POTENCIAL
Quim. Nova, Vol. 33, No. 3, 750-754, 2010 Educação ESTUDIO TEÓRICO DE LA ISOMERIZACIÓN DEL ÁCIDO MALEICO EN ÁCIDO FUMÁRICO: UN ENFOQUE BASADO EN EL CONCEPTO DE SUPERFICIE DE ENERGÍA POTENCIAL Ricardo Ugarte
COMPONENTES DEL PC LEONARDO OLIVARES VILLA MATEO CARDONA ARENAS
COMPONENTES DEL PC LEONARDO OLIVARES VILLA MATEO CARDONA ARENAS Tipos de procesadores. Dedicados: Para desarrollar una tarea muy especifica. Ejecutando un único algoritmo de forma óptima. de propósito
Tema 5 Jerarquía de Memoria
Grupo ARCOS Tema 5 Jerarquía de Memoria Estructura de Computadores Grado en Ingeniería Informática Contenidos 1. Tipos de memoria 2. Jerarquía de memoria 3. Memoria principal 4. Memoria caché 5. Memoria
Estructura Interna de La PC. 1. Microprocesadores 2. I/O ( Entrada / Salida) 3. Memoria
Estructura Interna de La PC 1. Microprocesadores 2. I/O ( Entrada / Salida) 3. Memoria Estructura Interna de La PC Estructura Interna de La PC Estructura Interna de La PC Estructura Interna de La PC Estructura
Tile64 Many-Core. vs. Intel Xeon Multi-Core
Tile64 Many-Core vs. Intel Xeon Multi-Core Comparación del Rendimiento en Bioinformática Myriam Kurtz Francisco J. Esteban Pilar Hernández Juan Antonio Caballero Antonio Guevara Gabriel Dorado Sergio Gálvez
1. Partes del ordenador. Nuevas Tecnologías y Sociedad de la Información
1 1. Conceptos básicos 2 Qué hacen los ordenadores? Un ordenador trabaja únicamente con información. Cuatro funciones básicas: Recibe información (entrada). Procesa la información recibida. Almacena la
ANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Matematicas de la especialidad automatica electronica
ANX-PR/CL/001-01 GUÍA DE APRENDIZAJE ASIGNATURA Matematicas de la especialidad automatica electronica CURSO ACADÉMICO - SEMESTRE 2016-17 - Segundo semestre GA_05TI_55000051_2S_2016-17 Datos Descriptivos
ARQUITECTURA DE VON NEUMANN Y HARVARD
ARQUITECTURA DE VON NEUMANN Y HARVARD ARQUITECTURA VON NEUMANN En esta arquitectura se observa que las computadoras utilizan el mismo dispositivo de almacenamiento para datos e instrucciones conectados
Tema 2: Conceptos básicos. Escuela Politécnica Superior Ingeniería Informática Universidad Autónoma de Madrid
Tema 2: Conceptos básicos Ingeniería Informática Universidad Autónoma de Madrid 1 O B J E T I V O S Introducción a la Informática Adquirir una visión global sobre la Informática y sus aplicaciones. Conocer
Ingeniería Informática
Grado en Ingeniería Informática Escuela Superior de Ingeniería Avda. de la Universidad de Cádiz, 10 11519 - Puerto Real (Cádiz) 95483200 grado.informatica@uca.es http://esingenieria.uca.es Itinerario Curricular
Comparativa de rendimiento: VirtualBox y VMware. Antoni Bofarull, Giulia Baldini, Guillermo Beltran
Comparativa de rendimiento: VirtualBox y VMware Antoni Bofarull, Giulia Baldini, Guillermo Beltran 1 Índice 1. Introducción 3 1.1. Motivación............................. 3 1.2. Objetivo...............................
0.Principios del Microprocesador
There are no translations available. La revolución tecnológica en integración de componentes ha llegado a extremos insospechados, un ejemplo los procesadores Dual Core.. PROCESADORES DE DOBLE NÚCLEO ÍNDICE
Estructuras y Topología de los Clústeres Cu 7 Zn 3
Estructuras y Topología de los Clústeres Cu 7 Zn 3 Tesis para optar al grado de Magister en Física Aplicada. Robinson González Tavera Director de Tesis Dr. Jorge David Escuela de Ciencias Básicas y Humanidades
Introducción a la Programación 1
Introducción a la Programación Dinámica Quiénes somos? Lucas Luppani: lucas.luppani@ing.austral.edu.ar Juan Longo: juan.longo@ing.austral.edu.ar Cuál va a ser la dinámica? Teóricas Prácticas Quizzes 2
Grupo de Computación Científica y Programación Paralela Universidad de Murcia
Grupo de Computación Científica y Programación Paralela Universidad de Murcia http://www.um.es/pcgum/ Presentación Líneas de Investigación, Máster en Informática, Universidad de Murcia, diciembre 2013
Propiedades electrónicas de la hoja de grafeno vs. hoja de nitruro de boro: una investigación por simulación
Rev. Cub. Física vol. 25 No.2B (2008) p.106-110 ISSN: 0253-9268. Original paper Revista Cubana de Física Calle I No. 302 e/ 15 y 17 Vedado, La Habana, CP 10400 www.fisica.uh.cu/biblioteca/revcubfi/index.htm
Competencias del máster en matemática computacional
Competencias del máster en matemática computacional En el Máster Universitario en Matemática Computacional por la Universitat Jaume I, se garantizará el desarrollo por parte de los estudiantes de las competencias
Sesión 7. Cálculo Paralelo en Elmer
Sesión 7. Cálculo Paralelo en Elmer M. Meis y F. Varas Departamento de Matemática Aplicada II Universidad de Vigo Introducción a Elmer, sofware libre de simulación numérica multifísica A Coruña, 27 de
Programación Lineal. María Muñoz Guillermo Matemáticas I U.P.C.T. M. Muñoz (U.P.C.T.) Programación Lineal Matemáticas I 1 / 13
Programación Lineal María Muñoz Guillermo maria.mg@upct.es U.P.C.T. Matemáticas I M. Muñoz (U.P.C.T.) Programación Lineal Matemáticas I 1 / 13 Qué es la Programación Lineal? Introducción La Programación
CygnusCloud: provisión de puestos de laboratorio virtuales bajo demanda
CygnusCloud: provisión de puestos de laboratorio virtuales bajo demanda Luis Barrios Hernández Adrián Fernández Hernández Samuel Guayerbas Martín Facultad de Informática - Universidad Complutense de Madrid
Presenta: Mat. Antonio Carrillo Ledesma. Tutor: Dr. Ismael Herrera Revilla
Universidad Nacional Autónoma de México Instituto de Geofísica Tesis Aplicaciones del Cómputo en Paralelo a la Modelación de Sistemas Terrestres Presenta: Mat. Antonio Carrillo Ledesma Para Obtener el
Paralelismo _Arquitectura de Computadoras IS603
Paralelismo _Arquitectura de Computadoras IS603 INTRODUCCION El objetivo de esta investigación, es conceptualizar las diferentes tipos de paralelismo referente al área de Arquitectura de Computadoras,
Seminario: Multicore Application Programming
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Facultad de Ingeniería Seminario: Multicore Application Programming Laboratorio de Intel para la Academia Proyecto PAPIME PE104911 Elabora: Ariel Ulloa Trejo Revisión:
Tema 1. Aspectos fundamentales en el diseño de computadores: Rendimiento, consumo y coste. Organización de Computadores I Rendimiento y Coste
Tema 1 Aspectos fundamentales en el diseño de computadores: Rendimiento, consumo y coste 1 Contenido Qué se entiende por arquitectura de computadores? Evolución del rendimiento de los computadores Tipos
PROGRAMACIÓN EN EL ENTORNO CUDA EN APLICACIONES DE MECÁNICA COMPUTACIONAL. PRUEBAS, RESULTADOS Y CONCLUSIONES CONCLUSIONES:
III. CONCLUSIONES: VELOCIDAD: La velocidad de la aplicación es elevada y satisfactoria. Para el mallado D se obtuvo una aceleración máxima de x200. Esta aceleración es especialmente debida al ahorro de
Kemio - Requisitos Técnicos
Kemio - Requisitos Técnicos Software Base Producto Versiones Soportadas MongoDB Community 3.2 / 3.4 Java JDK 6 / 8 Apache Tomcat 8.0 / 9.0 Hardware Ítem Mínimo Recomendado Notas CPU 64-bit 2.0+ GHz RAM
INFORME MEMORIA CACHE Y MEMORIA VIRTUAL.
AIEP PROGRAMACIÓN COMPUTACIONAL FUNDAMENTOS DE PROGRAMACIÓN INFORME MEMORIA CACHE Y MEMORIA VIRTUAL. Por:Diego Menéndez Introducción. Ante la inmensa velocidad de los procesadores que a medida del tiempo
Diseño de Sistemas Distribuidos Máster en Ciencia y Tecnología Informática Curso Presentación e introducción
Diseño de Sistemas Distribuidos Máster en Ciencia y Tecnología Informática Curso 2016-2017 Presentación e introducción Félix García Carballeira Grupo de Aruitectura de Computadores felix.garcia@uc3m.es
Doble Grado en Ingeniería Informática Tecnologías Informáticas y en Matemáticas
Curso 1º 1 2470003 Álgebra Lineal y Geometría I 12 A 1 2470004 Cálculo Infinitesimal 12 A 1 2470008 Fundamentos de Programación 12 A 1 2470002 Álgebra Básica 6 C1 1 2470006 Circuitos Electrónicos Digitales
REPORTAJE ESPECIAL Aspectos del hardware a tomar en cuenta para las instalaciones de SAP HANA
Aspectos del hardware a tomar en cuenta para las instalaciones de SAP HANA SAP HANA es una tecnología relativamente joven, y los primeros en adoptarla han aprendido lecciones valiosas para asegurar su
Algorítmica y Lenguajes de Programación. Eficiencia y notación asintótica (i)
Algorítmica y Lenguajes de Programación Eficiencia y notación asintótica (i) Eficiencia y notación asintótica. Introducción Para resolver un problema pueden existir varios algoritmos. Por tanto, es lógico