Arquitectura de Computadores II Clase #17

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Arquitectura de Computadores II Clase #17"

Transcripción

1 Arquitectura de Computadores II Clase #17 Facultad de Ingeniería Universidad de la República Instituto de Computación Curso 2009 Veremos Arquitecturas Paralelas 1

2 Taxonomía de Arquitecturas Paralelas (Flynn) Single instruction, single data stream: SISD Single instruction, multiple data stream: SIMD Multiple instruction, single data stream: MISD Multiple instruction, multiple data stream: MIMD Single Instruction, Single Data Stream - SISD Procesador único Flujo de instrucciones único Datos almacenados en memoria no compartida Ya lo vimos 2

3 Single Instruction, Multiple Data Stream - SIMD Cada instrucción de máquina controla la ejecución simultánea y sincronizada paso a paso sobre una cantidad de elementos de proceso Cada elemento de proceso tiene una memoria asociada Cada instrucción es ejecutada por cada procesador sobre un conjunto de datos diferentes Procesadores vectoriales y matriciales Procesamiento multimedia Procesadores Vectoriales (1/2) Problemas matemáticos que involucran procesos físicos presentan dificultades computacionales Aerodinámica, sismología, meteorología Simulaciones de campo continuo Alta precisión Cálculos repetitivos de punto flotante sobre grandes arrays de números Supercomputadores manejas estos problemas Cientos de millones de flops Muy costosos ($10-15 millones USD) Optimizados para cálculo Multitarea, I/O NO prioritarios (SI en mainframes) Mercado limitado I+D, gobierno, meteorología 3

4 Procesadores Vectoriales (2/2) Inicialmente desarrollados para aplicaciones de supercomputación, hoy en día son importantes en proceso multimedia Operaciones de alto nivel que operan sobre arrays de escalares: "vectores" SCALAR (1 operation) r1 + r3 r2 add r3, r1, r2 VECTOR (N operations) v1 + v3 v2 vector length vadd.vv v3, v1, v2 Propiedades de los Procesadores Vectoriales Se completa mucho trabajo en una sola instrucción vectorial (se ahorran loops) Menos fetch de instrucciones Cada resultado es independiente del anterior Se pueden ejecutar múltiples operaciones en paralelo Diseño simple, alta frecuencia de reloj Compilador (programador) asegura que no ocurran dependencias Se reducen saltos y los problemas asociados en el pipeline Instrucciones vectoriales acceden a memoria con un patrón conocido Prefetch efectivo Se amortiza la latencia de memoria con la carga de un gran número de elementos Se puede explotar un sistema con gran ancho de banda de memoria No se requieren caches (para los datos) 4

5 Estilos de Arquitecturas Vectoriales Procesadores vectoriales memoria-memoria Todas las operaciones vectoriales son de memoria a memoria Procesadores vector-registro Todas las operaciones vectoriales son entre registros vectoriales (excepto load/store de vectores) Equivalente vectorial de arquitecturas load-store Máquinas vectoriales a partir de fin de los 80s Un poco de historia... Activo desarrollo de arrays de procesadores SIMD entre fines de los 60 s mediados de los 70 s Cray-1!! Procesador escalar rápido y simple 80 MHz! Diseño mecánico y eléctrico exquisito Memoria de semiconductor Concepto de registro vectorial Gran simplificación del set de instrucciones Mejora uso de ancho de banda de memoria Alta integración de proceso vectorial y escalar Compiladores vectorizadores Cray dominó la computación de alta performance computing durante una década Y después? VLIW, extensiones SISD, clusters 5

6 Componentes de un Procesador Vectorial CPU escalar: registros, datapaths, lógica de fetch de instrucciones Registros vectoriales Banco de memoria de largo fijo almacena un único vector Típicamente 8-32 registros vectoriales (1-8 Kbits) Al menos 2 puertos de lectura y 1 de escritura Se pueden ver como elementos de 64b, 32b, 16b, 8b Unidades funcionales vectoriales (FUs) En pipeline, arrancan una operación por ciclo Típicamente 2 a 8 FUs: enteros y PF Unidades vectoriales load-store (LSUs) En pipeline, load/store de vectores Se leen/escriben múltiples elementos por ciclo Pueden tener múltiples LSUs Cross-bar para interconexión de FUs, LSUs, registros Cray-1: diagrama de bloques Instrucciones simples registro-registro de 16 bits Ops. de 32 bits con inmediatos Combinación natural de ops. escalares y vectoriales Scalar bit-vectors match vector length Operaciones gather/scatter entre memoria y registros Fundamental para trabajar con matrices sparse Ejecución condicional 6

7 Ejemplo de instrucciones vectoriales Instr. Operandos Operación Comentario VADD.VV V1,V2,V3 V1=V2+V3 vector + vector VADD.SV V1,R0,V2 V1=R0+V2 scalar + vector VMUL.VV V1,V2,V3 V1=V2xV3 vector x vector VMUL.SV V1,R0,V2 V1=R0xV2 scalar x vector VLD V1,R1 V1=M[R1..R1+63] load, stride=1 VLDS V1,R1,R2 V1=M[R1..R1+63*R2] load, stride=r2 VLDX V1,R1,V2 V1=M[R1+V2i,i=0..63] indexed("gather") VST V1,R1 M[R1..R1+63]=V1 store, stride=1 VSTS V1,R1,R2 V1=M[R1..R1+63*R2] store, stride=r2 VSTX V1,R1,V2 V1=M[R1+V2i,i=0..63] indexed( scatter") + todas las instrucciones normales (estilo RISC) Operaciones vectoriales de memoria Operaciones load/store mueven grupos de datos entre registros y memoria Tres tipos de direccionamiento Unit stride (opera sobre un vector) Más rápido Non-unit stride (opera sobre una tira de vectores) Indexed (gather-scatter) Equivalente vectorial de registro indirecto Adecuado para sparse arrays Permiten incrementar el código vectorizable Soporte de varias combinaciones de anchos de los datos en memoria {.L,.W,.H.,.B} x {64b, 32b, 16b, 8b} 7

8 Ejemplo de código vectorial Y[0:63] = Y[0:63] + a*x[0:63] SAXPY de 64 elementos : escalar LD R0,a ADDI R4,Rx,#512 loop: LD R2, 0(Rx) MULTD R2,R0,R2 LD R4, 0(Ry) ADDD R4,R2,R4 SD R4, 0(Ry) ADDI Rx,Rx,#8 ADDI Ry,Ry,#8 SUB R20,R4,Rx BNZ R20,loop SAXPY de 64 elementos : vectorial LD R0,a #load scalar a VLD V1,Rx #load vector X VMUL.SV V2,R0,V1 #vector mult VLD V3,Ry #load vector Y VADD.VV V4,V2,V3 #vector add VST Ry,V4 #store vector Y Aproximaciones al Procesamiento Multimedia Procesadores de propósito general con extensiones SIMD Procesadores Vectoriales VLIW con extensiones SIMD (aka mediaprocessors) Procesamiento Multimedia DSPs ASICs/FPGAs 8

9 Qué es el Procesamiento Multimedia? Desktop: Gráficos 3D (juegos) Reconocimiento de voz Decodificación video/audio (reproducción mpeg-mp3) Servidores: Codificación video/audio (servidores video, telefonía IP) Digital libraries/media mining (servidores video) Animación computarizada, modelado 3D & rendering (películas) Embedded: Gráficos 3D (cosolas de juegos) Codif/Decodif. de video/audio (set top boxes) Procesamiento de imágenes (cámaras digitales) Procesamiento de señal (teléfonos celulares) Se necesitan ISAs para multimedia Por qué no son suficientes las ISAs de propósito general para multimedia? Performance Athlon 1.2GHz: codificación MPEG-4 a 6.4fps Un canal W-CDMA de 384Kbps requiere 6.9 GOPS Consumo Athlon 1.2GHz consume ~60W Consumo se incrementa con la frecuencia y complejidad Costo Manufactura del Athlon 1.2GHz cuesta ~U$S62 y tiene un precio de lista de ~U$S600 El costo crece con complejidad, área, cantidad de transistores, potencia, etc 9

10 Ejemplo: Decodificación MPEG Input Stream Parsing Dequantization IDCT Block Reconstruction RGB->YUV Load Breakdown 10% 20% 25% 30% 15% Output to Screen Ejemplo: Gráficos 3D Geometry Pipe Display Lists Transform Lighting Setup Load Breakdown 10% 10% Rendering Pipe Rasterization Anti-aliasing Shading, fogging Texture mapping Alpha blending Z-buffer Clipping Frame-buffer ops Output to Screen 35% 55% 10

11 Características de aplicaciones multimedia (1/2) Requerimiento de respuesta en tiempo real Se prefiere resultado incorrecto a tardío Lo impredecible puede dar problemas (por ejemplo ejecución dinámica) Tipos de datos angostos Ancho típico de datos en memoria: 8 a 16 bits Ancho típico de datos durante el cómputo: 16 a 32 bits Datos de 64-bit raramente se necesitan Aritmética de Punto Fijo reemplaza frecuentemente a Punto Flotante Paralelismo de grano fino Idéntica operación se aplica a flujos de datos de entrada Bifurcaciones predecibles Alta localidad en pequeños loops o kernels Características de aplicaciones multimedia (2/2) Paralelismo de grano grueso Mayoría de las aplicaciones organizadas como un pipeline de funciones Se pueden usar múltiples threads de ejecución Requirementos de memoria Se necesita gran Ancho de Banda, pero se tolera alta latencia Alta localidad espacial (patrón predecible) pero poca localidad temporal Importante: cache bypassing & prefetching 11

12 Ejemplos de Funciones Mmedia Matrix transpose/multiply DCT/FFT Motion estimation Gamma correction Haar transform Median filter Separable convolution Viterbi decode Bit packing Galois-fields arithmetic (3D graphics) (Video, audio, communications) (Video) (3D graphics) (Media mining) (Image processing) (Image processing) (Communications, speech) (Communications, cryptography) (Communications, cryptography) Extensiones SIMD para GPP Motivación Baja performance de procesamiento mmedia en GPPs Costo y poca flexibilidad de ASICs especializados para gráficos/video Infrautilización de datapaths y registros Idea básica : sub-word parallelism Tratar un registro de 64-bit como un vector de 2x32-bit, 4x16-bit o 8x8-bit (short vectors) Partición de datapaths de 64 bit para manejar múltiples operaciones angostas en paralelo Restricciones iniciales No agregar área (registros) No agregar excepciones 12

13 Revisión de extensiones SIMD Vendor HP Sun Intel AMD Motorola Intel MIPS AMD Intel Intel Extension MAX-1 & 2 VIS MMX 3DNow! Altivec SSE MIPS-3D E 3DNow! SSE-2 SSE-3 Year 94, ? # Instr 9,8 (int) 121 (int) 57 (int) 21 (fp) 162 (int,fp) 70 (fp) 23 (fp) 24 (fp) 144(int,fp) 13 new, hyper-tread MMX: MultiMedia exension SSE: Streaming SIMD Extensions Registers Int 32x64b FP 32x64b FP 8x64b FP 8x64b 32x128b (new) 8x128b (new) FP 32x64b 8x128 (new) 8x128 (new) Resumen de operaciones SIMD (1/2) Aritmética entera Suma y resta con saturación Modos de redondeo en punto fijo para multiplicación y shift Suma de diferencias absolutas Multiply-add, multiplicación con reducción Min, max Aritmética de punto flotante Operaciones de punto flotante empaquetado Raíz cuadrada, recíproco Exception masks Comunicación de datos Merge, insert, extract Pack, unpack (con conversión) Permute, shuffle 13

14 Resumen de operaciones SIMD (2/2) Comparaciones Comparación de enteros y FP empaquetado Comparación de valores absolutos Element masks and bit vectors Memoria No hay nuevas instrucciones load-store para short vectors No soporta strides o indexing Short vectors semanejan con load/store normales Pack, unpack, shift, rotate, shuffle para manejar alineamientos de los datos Prefetch de instrucciones para utilizar la localidad temporal Programación con extensiones SIMD Shared libraries optimizadas Escritas en assembler, distribuídas por el fabricante Se necesita API bien definida para formatear datos y usarla Macros de lenguajes para variables y operaciones Wrappers C/C++ para variables short vector y llamados a funciones Permiten scheduling de instrucciones y optimizaciones de asignaciones de registros para procesadores específicos No portable, no estándar Compiladores para extensiones SIMD En los hechos, no hay compiladores disponibles Problemas Soporte para expresar aritmética de punto fijo y paralelismo SIMD Modelo complicado para load/store de vectores Actualizaciones frecuentes Assembler! 14

15 Diseño de un Procesador Vectorial Cambios a core escalar Decodificar instrucciones vectoriales Enviar registros escalares a unidad vectorial (ops. vector-escalar) Sincronización de resultados de registros vectoriales, incluyendo excepciones Código no vectorial no tiene alta ILP, se puede simplificar la CPU escalar Cómo elegir la longitud máxima de vector? Cómo elegir la cantidad de registros vectoriales? Context switch overhead? Manejo de excepciones? Por qué vectores para multimedia? Paralelismo en multimedia Alta performance a bajo costo Múltiples ops/ciclo, se completa 1 instr/ciclo Múltiples ops/ciclo con bajo consumo Patrón de acceso estructurado para registros y memoria Escalable Mayor performance agregando lanes sin modificaciones de la arquitectura Código compacto N operaciones con 1 instrucción corta (v. VLIW) Performance predecible No se necesitan caches ni ejecución dinámica Tecnología de compiladores madura 15

16 Resumen SIMD Extensiones de vectores angostos para GPPs Registros de 64b o 128b como vectores con lementos de 32b, 16b, y 8b Basado en sub-word parallelism y datapaths particionados Instrucciones Punto-fijo y punto flotante empaquetado, multiply-add, reducciones Pack, unpack, permutaciones Soporte limitado de memoria Mejora de performance 2x a 4x sobre la arquitectura base Limitado por ancho de banda de memoria Difícil de usar (no hay compiladores) Resumen de Vectores Modelo alternativo para expresar explícitamente el paralelismo en los datos Si el código es vectorizable, entonces el hardware se simplifica, mejora la eficiencia del consumo, y mejor modelo de tiempo real que máquinas out-of-order con soporte SIMD Temas de diseño incluyen cantidad de lanes, cantidad de unidades funcionales, cantidad y tamaño de registros vectoriales, manejo de excepciones, operaciones condicionales Revivirán las arquitecturas vectoriales gracias a la popularidad de la multimedia? 16

17 Multiple Instruction, Single Data Stream - MISD Secuencia de datos Transmitida a un conjunto de procesadores Cada procesador ejecuta una secuencia de instrucciones diferente sobre la misma secuencia de datos Nunca se implementó (?) Multiple Instruction, Multiple Data Stream- MIMD Conjunto de procesadores Ejecutan simultáneamente secuencias de instrucciones diferentes Diferentes conjuntos de datos Procesadores de propósito general Se clasifican de acuerdo a como es la comunicación: Multiprocesadores Simétricos (SMPs) Varios procesadores, memoria compartida Sistemas de Acceso No Uniforme a Memoria (NUMA) Clusters Conjunto de computadores conectados en red 17

18 MIMD, organización de la memoria MIMD Memoria Compartida MIMD Memoria Distribuida Multiprocesadores Simétricos: Sistemas fuertemente acoplados Computador stand alone con las siguientes características Dos o más procesadores similares, de capacidad comparable Procesadores comparten memoria y E/S Conectedos por un bus u otra conexión interna Tiempo de acceso es similar para cada procesador Acceso a los mismos dispositivos de E/S usando canales compartidos (o no) Todos los procesadores pueden desempeñar las mismas funciones -> simétricos Sistema Operativo integrado Provee interacción entre procesadores Interaccion a nivel de job, tarea, archivos y datos Por oposición a los clusters (débilmente acoplados), que interactuán a nivel de mensajes y/o archivos completos 18

19 Ventajas SMP En un SMP el SO planifica la distribución de procesos o threads entre todos los procesadores (transparente al usuario). Ventajas: Performance Si el trabajo se puede paralelizar Disponibilidad Dado que todos los procesadores desempeñan las mismas funciones, el fallo de un procesador no detiene el sistema Crecimiento incremental Se pueden aumentar las prestaciones agregando procesadores Escalabilidad Se pueden ofrecer distintas configuraciones/prestaciones basadas en la cantidad de procesadores Sistemas fuertemente acoplados: Diagrama de bloques Alternativas de organización Bus común o de tiempo compartido Memoria Multipuerto Unidad de control central Los procesadores se comunican mediante la memoria (área de datos compartida), y pueden intercambiar señales directamente 19

20 Bus de tiempo compartido (1/2) Simple. Estructura e interfaces similares a sistemas monoprocesador Se necesita Direccionamiento, para distinguir módulos en el bus Arbitraje: cada módulo puede ser master temporariamente Tiempo compartido: si un módulo controla el bus, el resto debe esperar Bus de tiempo compartido (2/2) Ventajas Simplicidad Flexibilidad Confiabilidad Desventajas Performance limitada por el ciclo de bus Cada procesador debe tener un cache local Reducir la cantidad de accesos al bus Lleva a problemas con la coherencia del cache Se resuelve en hardware 20

21 Que debe hacer el Sistema Operativo? El usuario debe tener la percepción de un control único de los recursos del sistema El SMP se debe comportar como un sistema monoprocesador con multiprogramación, con las características adicionales que permitan usar varios procesadores. El diseño debe asegurar: Procesos concurrentes simultaneos Rutinas reentrantes, manejo de tablas del sistema Planificación (scheduling, co- scheduling) Sincronización Asegurar mutua exclusión y orden de eventos Gestón de memoria Confiabilidad, tolerancia a fallos Coherencia del Cache Problema: múltiples copias de los mismos datos en diferentes caches Write back puede llevar a inconsistencias Write through puede dar problemas si las caches no monitorizan el tráfico de memoria Soluciones de software Compilador y SO se encargan del problema Overhead en tiempo de compilación El compilador toma decisiones conservadoras, uso ineficiente del cache Estrategia usual: datos compartidos no-cacheables Solución de hardware, protocolos de coherencia del cache Reconocimiento dinámico de problemas en run time Uso más eficiente del cache, transparente al programador Protocols de directorio Snoopy protocols 21

22 Clusters NOWs y Clusters (1/2) Avances en redes de alta velocidad y performance de microprocesadores: redes de computadores son una opción económica para computación paralela: COTS Desarrollo de Linux y BSD OSs, compiladores y herramientas de programación GNU proveen una base de software público, independiente del hardware Disponibilidad universal de sistemas COTS, redes de alta performance y software de base abierto: Arquitecturas y modelos de programación genéricos para construir NOWs y clusters. Queremos utilizar los ciclos de CPU y otros recursos de las estaciones de trabajo de usuarios cuando están ociosas? NOWs Queremos HPC (High Performance Computation) mediante paralelismo? Clusters 22

23 NOWs y Clusters (2/2) Nodos de un cluster: Dedicados Alivia problemas de balance de carga La performance de cada nodo solo depende de la aplicación HPC Interconexión de nodos de un cluster Dedicada y aislada de la red externa Carga de la red determinada únicamente por la aplicación corriendo en el cluster Se evitan problemas de variaciones inesperados de la latencia que presentan las NOWs. Nodos del cluster NO accesibles desde la red externa Se pueden alivianar requerimientos de seguridad Se evita ssh y otros consumidores de CPU Desafíos Como resolver la distribución de los recursos de manera transparente y eficiente? Interconexión Transparencia Memoria y disco distribuido Proyecto NOW de Berkeley: GLUnix Este sistema operó durante algunos años llegando a tener una comunidad de cientos de usuarios Experiencia en resolución de los problemas mencionados 23

24 Clusters Alternativa a SMP Alta performance Alta disponibilidad Aplicaciones de servidor Grupo de computadores (nodos) interconectados Trabajando en conjunto como un recurso unificado Ilusión de ser una sola máquina (?) Beneficios del cluster Escalabilidad incremental Alta disponibilidad Mejor relación precio/performance Componentes COTS Clusters: el Sistema Operativo Gestión de Fallos Alta disponibilidad Tolerancia a fallos Failover Conmutar aplicaciones y datos del sistema en falta a uno alternativo en el cluster Failback Restaurar aplicaciones y datos al sistema original Una vez que se resolvió el problema Balance de carga Escalabilidad incremental Incluir nuevos sistemas en la planificación el cluster Middleware debe ser capaz de migrar procesos entre máquinas 24

25 Clusters: Computación Paralela (HPC) Aplicación única ejecutando en paralelo en determinada cantidad de máquinas del cluster Compilador Determina en tiempo de compilación que parte del código se puede paralelizar Partición para diferentes computadores Aplicación Código escrito desde cero para ejecutarse en paralelo Pasaje de mensajes para mover datos entre nodos Difícil de programar Mejor resultado final Computación paramétrica Problema repetido sobre diferentes conjuntos de datos Ej. simulación usando diferentes escenarios Se necesitan herramientas de planificación Arquitectura Cluster 25

26 Middleware de Cluster Imagen unificada al usuario Single system image Único punto de entrada Única jerarquía de archivos Espacio de memoria unificado (?) Gestión de jobs unificada Interfaz de usuario única Espacio de E/S único (?) Espacio de procesos unificado Checkpointing Migración de Procesos Middleware de cluster Open Scalable Cluster Environment: KSIX OSCAR : Open Source Cluster Application Resources Paquete integrado de software diseñado para HPC, todo incluído 26

27 Ejemplo: Beowulf Beowulf es el poema épico en inglés más antiguo. Es la presentación de un hombre (Beowulf) como el ejemplo ideal de la cultura heroica germánica, con un simbolismo explícito del conflicto del hombre con las energías del mal. Iniciado en 1994 bajo los auspicios del Proyecto HPPC (High Performance Computing and Communications) de la NASA. Octubre de 1996: sobrepasado el Gigaflop de performance en una aplicación espacial científica a un costo menor a 50 mil USD Primer Beowulf construido con DX4 y Ethernet de 10 Mbps. Balance de carga de red: channel bonded Hacia 1997 un Beowulf típico estaba constituido por 16 procesadores P6 de 200 Mhz con Fast Ethernet conmutado mediante un switch Beowulf, características fundamentales (1/3) Concepto PoPC: pila/conjunto de PCs ensamblados para resolver un problema: Componentes COTS Procesadores dedicados (en lugar de buscar ciclos de CPU en la NOW) System Area Network (SAN) dedicada Ventaja: no existen derechos propietarios motherboards, controladores, dispositivos de E/S y cases estándar. Asimismo se utilizan interfaces estándar como el bus PCI, dispositivos IDE y SCSI, y placas de red Ethernet. Al dia con la tecnología Cada cluster se arma con la tecnología mejor y más barata disponible en el momento. No existen dos clusters iguales, aunque corran el mismo software de base 27

28 Beowulf, características fundamentales (2/3) Software de base: SOs Linux y BSD Shells y compiladores estándar para la mayoría de los lenguajes de programación Las dos librerías de pasajes de mensajes, PVM y MPI, están disponibles en estos SOs Problemas Gestión de recursos y herramientas de software para la computación paralela Latencia y anchos de banda modestos de interconexiones como Fast Ethernet. Este problema se ha atacado mediante tunning del software y desarrollo de topologías de red adecuadas Beowulf, características fundamentales (3/3) Aplicación inicial estilo SIMD: Discos en cada nodo, sin distinguir nodos de computación y nodos de E/S, y con bonding de placas Fast Ethernet Soporte para aplicaciones que damandan alta performance de punto flotante y baja latencia Disponibilidad de multiprocesadores de pequeña escala (2 a 4 procesadores) que se pueden agregar al cluster bajo demanda 28

29 Software de cluster, transparencia Software de cluster: agregado al Sistema Operativo PVM, MPI Subsistema de red mejorado notoriamente, soporte de dispositivos Cada nodo ejecuta su copia del kernel Cara uniforme del sistema para los usuarios y las aplicaciones: participación de los nodos en un espacio de nombres global Procesos normales en Unix pertenecen al kernel que los ejecuta, y tienen un identificador único en ese contexto. En un entorno distribuido es conveniente que el process ID sea único en el cluster GPID Beowulf original basados en Task IDs de PVM: no hay transparencia real BPROC: Beowulf Distributed Process Space (1/3) Implementación de un espacio de PIDs distribuido Procesos aparecen en árbol de procesos local aunque en realidad estén físicamente en otro nodo Espacio de PIDs distribuidos por un master. Los nodos que ejecutan procesos para el master son esclavos Cada espacio de PIDs corresponde a un nodo Cada nodo puede ser master de un único espacio de PIDs, pero puede ser esclavo de más de un espacio de PIDs No ataca el problema del manejo de recursos y/o balance de carga en el cluster Bproc consiste de cuatro partes básicas: Ghost processes en el front end Process ID masquerading en los nodos remotos Virtual Memory Area dumper (VMADump) para trasportar procesos Daemons en el master y el esclavo para unificar el funcionamiento 29

30 BPROC: Beowulf Distributed Process Space (2/3) BPROC: Beowulf Distributed Process Space (3/3) 30

31 Otros componentes: Memoria, File System Memoria Distribuida Compartida File systems paralelos: Jovian (University of Maryland at College Park) Parallel Virtual File System (PVFS) desarrollado en Clemson Características PVFS: Espacio de nombres consistente Acceso transparente para utilitarios existentes Distribución física de los datos entre nodos del cluster Acceso de alta performance para aplicaciones de usuario PVFS puede ser montado en todos los nodos, en el mismo subdirectorio simultáneamente Una vez montado los archivos y directorios PVFS pueden operarse con las utilidades habituales (ls, cp, rm) Construyendo el cluster, networking Interconexión de los sistemas tipo PoPCs puede ser un cuello de botella de la performance del cluster Topologías tradicionales tipo Toroidal Hyper-Meshes utilizadas en los sistemas MPPs: cada nodo debe actuar como enrutador, agregando latencia y overhead de procesamiento Fast/Gigabit Ethernet es la más utilizada en PoPCs, con switches para la interconexión: queremos switches non-blocking funcionando a wire-speed Beowulf: Channel Bonding Algunos switches se confunden : MAC cloning Performance del bonding limitada por el overhead en la placa, el bus PCI, las interrupciones Otras tecnologías: myrinet, infiniband 31

32 Clusters vs. SMP Ambos proveen soporte multiprocesador para aplicaciones demandantes Ambos disponibles comercialmente SMP más viejo SMP: Gestión y Control simplicado Más parecido a sistemas uni-procesador La planificación es la diferencia fundamental Menos espacio físico Menos consumo de energía Cluster: Escalabilidad absoluta e incremental superior Mayor disponibilidad Redundancia Supercomputadores (Junio 2005) Rank! Site Country/Year! 1! DOE/NNSA/LLNL United States/2005! 2! IBM Thomas J. Watson Research Center United States/2005! 3! NASA/Ames Research Center/NAS United States/2004! 4! The Earth Simulator Center Japan/2002! 5! Barcelona Supercomputer Center Spain/2005! 6! ASTRON/University Groningen Netherlands/2005! 7! Lawrence Livermore National Laboratory United States/2004! 8! Computational Biology Research Center, AIST Japan/2005! 9! Ecole Polytechnique Federale de Lausanne Switzerland/2005! 10! Sandia National Laboratories United States/2005! Computer / Proce ssors Manufacturer! BlueGene/L eserver Blue Gene Solution / IBM! BGW eserver Blue Gene Solution / IBM! Columbia SGI Altix 1.5 GHz, Voltaire Infiniband / SGI! Earth-Simulator / 5120 NEC! MareNostrum JS20 Cluster, PPC 970, 2.2 GHz, Myrinet / 4800 IBM! eserver Blue Gene Solution / IBM! Thunder Intel Itanium2 Tiger4 1.4GHz - Quadrics / 4096 California Digital Corporation! Blue Protein eserver Blue Gene Solution / 8192 IBM! eserver Blue Gene Solution / 8192 IBM! Red Storm, Cray XT3, 2.0 GHz / 5000 Cray Inc.! Rmax Rpeak! ! ! ! ! ! ! ! ! ! ! Computer Type indicated by manufacturer or vendor Processors Number of processors R max Maximal LINPACK performance achieved R peak Theoretical peak performance Mas info: 32

33 Supercomputadores (Junio 2006) Supercomputadores (Junio 2007) 33

34 34

35 Recapitulando... quién necesita un cluster? Supercomputación paralela, HPC tiene sentido cuando existen aplicaciones que pueden beneficiarse de ella: Análisis de Elementos Finitos Sísmica; análisis de datos Fluido dinámica computacional Análisis financiero Investigación médica y genética Problemas de optimización Pattern matching Data mining, Data archival and sorting Application, Transaction, Calculation y Data serving... Cluster: alto grado de acoplamiento NO es NOW, ni Granjas de Servidores, ni GRID Grid Compartir y usar recursos en forma flexible, segura y coordinada Colecciones dinámicas de individuos e instituciones Distribución geográfica y organizacional Organizaciones virtuales Las tecnologías Grid incluyen soluciones de seguridad protocolos y servicios de gestión de recursos protocolos y servicios de búsqueda de información servicios de gestión de datos 35

36 Relación entre Grid y otras tecnologías WWW Ubicuidad: Portales OV Proveedores de aplicaciones y almacenamiento Pueden beneficiarse de las tecnologías Grid (delegación, control de acceso, conteo y pago) Enterprise computing systems Corba, EJB, J2EE,.NET no se adaptan perfectamente a las necesidades de Grid: Interacción cliente-servidor, Interconexión relativamente estática y restringidas a la organización Sin embargo, son adecuadas para la construcción de software necesario para Grid Peer-to-peer computing Mucho en común, tienden a converger Arquitectura Grid - introducción Basada en protocolos y servicios Abierta La interoperabilidad: punto central nuevos participantes dinámicamente diferentes plataformas favorece la formación de OVs 36

37 Arquitectura Grid - capas Fabric Controlador de recursos Información, gestión de recursos Connectivity Autenticación Comunicaciones Requerimientos para las OVs Single sign on Delegación Integración con soluciones de seguridad existentes Protección de comunicaciones Resource Compartir un recurso individual Protocolos de información Protocolos de gestión Arquitectura Grid - capas Collective coordinación de múltiples recursos servicios de directorio servicios de asignación y scheduling servicios de monitorización y diagnóstico servicios de replicación servicios de descubrimiento de software de Grid servicios de autorización de comunidad servicios de contabilidad y pago Aplication aplicaciones de usuario que operan en una OV 37

38 Arquitectura Grid - OGSA OGSA - Open Grid Services Architecture Integra conceptos de Globus Toolkit + WebServices Componentes de Globus Toolkit más relevantes para OGSA Protocolo GRAM (Grid Resource Allocation and Management) MDS-2 (Meta Directory Service) GSI (Grid Security Infrastructure) Ventajas del framework de Web Services Descubrimiento dinámico y armado de servicios en ambientes heterogéneos. Uso de herramientas y servicios existentes Globus Toolkit Middleware open source Estándar de hecho Nuevas versiones (v3 y 4) basadas en OGSA Implementación Grid - Planet Lab Infrastrucutura distribuida de escala planetaria para experimentar protocolos y servicios de red Globus: estándares Planet Lab: rough consensus and working code :) Algunos servicios en Planet Lab Redes de distribución de contenido Overlays de enrutamiento robusto Servicios de medida y monitorización de red Almacenamiento embebido en la red Multicast a nivel de aplicación Comunidad de usuarios: academia, interés en probar la ifrastructura de red Aplicaciones de red intensivas NO CPU-intensivas en general API mínima, servicios dependen de los usuarios Por oposición a la rica estructura de servicios que da Globus 38

Arquitectura de Computadores II Clase #17

Arquitectura de Computadores II Clase #17 Arquitectura de Computadores II Clase #17 Facultad de Ingeniería Universidad de la República Instituto de Computación Curso 2010 Veremos Arquitecturas Paralelas 1 Taxonomía de Arquitecturas Paralelas (Flynn)

Más detalles

Arquitectura de Computadores II Clase #17

Arquitectura de Computadores II Clase #17 Arquitectura de Computadores II Clase #17 Facultad de Ingeniería Universidad de la República Instituto de Computación Curso 2010 Veremos Arquitecturas Paralelas Taxonomía de Arquitecturas Paralelas (Flynn)

Más detalles

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011 Clusters Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011 Introducción Aplicaciones que requieren: Grandes capacidades de cómputo: Física de partículas, aerodinámica, genómica, etc. Tradicionalmente

Más detalles

:Arquitecturas Paralela basada en clusters.

:Arquitecturas Paralela basada en clusters. Computación de altas prestaciones: Arquitecturas basadas en clusters Sesión n 1 :Arquitecturas Paralela basada en clusters. Jose Luis Bosque 1 Introducción Computación de altas prestaciones: resolver problemas

Más detalles

INTRODUCCIÓN. Que es un sistema operativo? - Es un programa. - Funciona como intermediario entre el usuario y los programas y el hardware

INTRODUCCIÓN. Que es un sistema operativo? - Es un programa. - Funciona como intermediario entre el usuario y los programas y el hardware INTRODUCCIÓN Que es un sistema operativo? - Es un programa. - Funciona como intermediario entre el usuario y los programas y el hardware INTRODUCCIÓN METAS: Brindar un entorno para que los usuarios puedan

Más detalles

CLUSTER FING: ARQUITECTURA Y APLICACIONES

CLUSTER FING: ARQUITECTURA Y APLICACIONES CLUSTER FING: ARQUITECTURA Y APLICACIONES SERGIO NESMACHNOW Centro de Cálculo, Instituto de Computación FACULTAD DE INGENIERÍA, UNIVERSIDAD DE LA REPÚBLICA, URUGUAY CONTENIDO Introducción Clusters Cluster

Más detalles

FUNDAMENTOS DE COMPUTACIÓN PARA CIENTÍFICOS. CNCA Abril 2013

FUNDAMENTOS DE COMPUTACIÓN PARA CIENTÍFICOS. CNCA Abril 2013 FUNDAMENTOS DE COMPUTACIÓN PARA CIENTÍFICOS CNCA Abril 2013 6. COMPUTACIÓN DE ALTO RENDIMIENTO Ricardo Román DEFINICIÓN High Performance Computing - Computación de Alto Rendimiento Técnicas, investigación

Más detalles

Capítulo 5. Cliente-Servidor.

Capítulo 5. Cliente-Servidor. Capítulo 5. Cliente-Servidor. 5.1 Introducción En este capítulo hablaremos acerca de la arquitectura Cliente-Servidor, ya que para nuestra aplicación utilizamos ésta arquitectura al convertir en un servidor

Más detalles

UNIVERSIDAD TECNOLOGICA ECOTEC DIEGO BARRAGAN MATERIA: Sistemas Operativos 1 ENSAYO: Servidores BLADE

UNIVERSIDAD TECNOLOGICA ECOTEC DIEGO BARRAGAN MATERIA: Sistemas Operativos 1 ENSAYO: Servidores BLADE UNIVERSIDAD TECNOLOGICA ECOTEC DIEGO BARRAGAN MATERIA: Sistemas Operativos 1 ENSAYO: Servidores BLADE AÑO: 2010 Qué es un servidor Blade? Blade Server es una arquitectura que ha conseguido integrar en

Más detalles

Introducción Componentes Básicos Concurrencia y Paralelismo Ejemplos Síntesis Lecturas Recomendadas. Arquitectura de Computadoras

Introducción Componentes Básicos Concurrencia y Paralelismo Ejemplos Síntesis Lecturas Recomendadas. Arquitectura de Computadoras Arquitectura de Computadoras Contenidos 1 Introducción Computadora Arquitectura Partes de una arquitectura 2 Componentes Básicos CPU Jerarquía de Memoria 3 Concurrencia y Paralelismo Arquitecturas concurrentes

Más detalles

General Parallel File System

General Parallel File System General Parallel File System Introducción GPFS fue desarrollado por IBM, es un sistema que permite a los usuarios compartir el acceso a datos que están dispersos en múltiples nodos; permite interacción

Más detalles

4. Programación Paralela

4. Programación Paralela 4. Programación Paralela La necesidad que surge para resolver problemas que requieren tiempo elevado de cómputo origina lo que hoy se conoce como computación paralela. Mediante el uso concurrente de varios

Más detalles

INTRODUCCION. Ing. Camilo Zapata czapata@udea.edu.co Universidad de Antioquia

INTRODUCCION. Ing. Camilo Zapata czapata@udea.edu.co Universidad de Antioquia INTRODUCCION. Ing. Camilo Zapata czapata@udea.edu.co Universidad de Antioquia Qué es una Red? Es un grupo de computadores conectados mediante cables o algún otro medio. Para que? compartir recursos. software

Más detalles

No se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos.

No se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos. RAIDS MODO LINEAL Es un tipo de raid que muestra lógicamente un disco pero se compone de 2 o más discos. Solamente llena el disco 0 y cuando este está lleno sigue con el disco 1 y así sucesivamente. Este

Más detalles

Modelos de los sistemas distribuidos. Jorge Iván Meza Martínez jimezam@gmail.com

Modelos de los sistemas distribuidos. Jorge Iván Meza Martínez jimezam@gmail.com Modelos de los sistemas distribuidos Jorge Iván Meza Martínez jimezam@gmail.com Especialización en Gestión de Redes de Datos Universidad Nacional de Colombia Sede Manizales 1/36 Contenidos Modelo arquitectónico

Más detalles

Introducción HPC. Curso: Modelización y simulación matemática de sistemas. Esteban E. Mocskos (emocskos@dc.uba.ar) Escuela Complutense Latinoamericana

Introducción HPC. Curso: Modelización y simulación matemática de sistemas. Esteban E. Mocskos (emocskos@dc.uba.ar) Escuela Complutense Latinoamericana Curso: Modelización y simulación matemática de sistemas Metodología para su implementación computacional Introducción HPC Esteban E. Mocskos (emocskos@dc.uba.ar) Facultad de Ciencias Exactas y Naturales,

Más detalles

Clusters de Alto Rendimiento

Clusters de Alto Rendimiento Clusters de Alto Rendimiento Contenido: M. en A. Iliana Gómez Zúñiga iliana.gomez@redudg.udg.mx Expositor: L.S.I. Virgilio Cervantes Pérez virgilio@cencar.udg.mx Diseño: Lic. Genaro Ramirez genaro.ramirez@redudg.udg.mx

Más detalles

Plataformas paralelas

Plataformas paralelas Plataformas paralelas Curso 2011-2012 Elementos de un computador paralelo Hardware: Múltiples procesadores Múltiples memorias Redes de interconexión Software: Sistemas Operativos paralelos Programas orientados

Más detalles

Unidad I Fundamentos de Sistemas Distribuidos. M.C. Juan Carlos Olivares Rojas

Unidad I Fundamentos de Sistemas Distribuidos. M.C. Juan Carlos Olivares Rojas Unidad I Fundamentos de Sistemas Distribuidos M.C. Juan Carlos Olivares Rojas Temario 1.1. Características de un sistema distribuido 1.2. Objetivos de los sistemas distribuidos 1.3. Ventajas y desventajas

Más detalles

Modelo de aplicaciones CUDA

Modelo de aplicaciones CUDA Modelo de aplicaciones CUDA Utilización de GPGPUs: las placas gráficas se utilizan en el contexto de una CPU: host (CPU) + uno o varios device o GPUs Procesadores masivamente paralelos equipados con muchas

Más detalles

Arquitectura: Clusters

Arquitectura: Clusters Universidad Simón Bolívar Arquitectura: Clusters Integrantes: - Aquilino Pinto - Alejandra Preciado Definición Conjuntos o conglomerados de computadoras construidos mediante la utilización de hardware

Más detalles

1. Introducción 2. Historia 3. Características clave 4. Cuestiones de diseño

1. Introducción 2. Historia 3. Características clave 4. Cuestiones de diseño Tema 1. Introducción a los sistemas distribuidos 1. Introducción 2. Historia 3. Características clave 4. Cuestiones de diseño Tema 1 Introducción a los Sistemas Distribuidos 1 Introducción y objetivos

Más detalles

Linux Week PUCP. Computación de Alto Rendimiento en Linux. rmiguel@senamhi.gob.pe

Linux Week PUCP. Computación de Alto Rendimiento en Linux. rmiguel@senamhi.gob.pe Linux Week PUCP 2006 Computación de Alto Rendimiento en Linux Richard Miguel San Martín rmiguel@senamhi.gob.pe Agenda Computación Científica Computación Paralela High Performance Computing Grid Computing

Más detalles

DISCOS RAID. Se considera que todos los discos físicos tienen la misma capacidad, y de no ser así, en el que sea mayor se desperdicia la diferencia.

DISCOS RAID. Se considera que todos los discos físicos tienen la misma capacidad, y de no ser así, en el que sea mayor se desperdicia la diferencia. DISCOS RAID Raid: redundant array of independent disks, quiere decir conjunto redundante de discos independientes. Es un sistema de almacenamiento de datos que utiliza varias unidades físicas para guardar

Más detalles

TEMA 4: SISTEMAS MULTIPROCESADOR (MEMORIA COMPARTIDA) BLOQUE 2 Arquitecturas de computación paralela

TEMA 4: SISTEMAS MULTIPROCESADOR (MEMORIA COMPARTIDA) BLOQUE 2 Arquitecturas de computación paralela TEMA 4: SISTEMAS MULTIPROCESADOR (MEMORIA COMPARTIDA) BLOQUE 2 Arquitecturas de computación paralela 2 CONTENIDOS DE LA UNIDAD 4.4 Diseño de arquitecturas de memoria compartida y compartida-distribuida.

Más detalles

Soluciones innovadoras para optimizar su infraestructura TI. Virtualización con el sistema operativo i, PowerVM y Power Systems de IBM

Soluciones innovadoras para optimizar su infraestructura TI. Virtualización con el sistema operativo i, PowerVM y Power Systems de IBM Soluciones innovadoras para optimizar su infraestructura TI Virtualización con el sistema operativo i, PowerVM y Power Systems de IBM Características principales Tenga éxito en su negocio simplemente con

Más detalles

Introducción a las redes de computadores

Introducción a las redes de computadores Introducción a las redes de computadores Contenido Descripción general 1 Beneficios de las redes 2 Papel de los equipos en una red 3 Tipos de redes 5 Sistemas operativos de red 7 Introducción a las redes

Más detalles

SISTEMAS DE INFORMACIÓN II TEORÍA

SISTEMAS DE INFORMACIÓN II TEORÍA CONTENIDO: EL PROCESO DE DISEÑO DE SISTEMAS DISTRIBUIDOS MANEJANDO LOS DATOS EN LOS SISTEMAS DISTRIBUIDOS DISEÑANDO SISTEMAS PARA REDES DE ÁREA LOCAL DISEÑANDO SISTEMAS PARA ARQUITECTURAS CLIENTE/SERVIDOR

Más detalles

Arquitecturas GPU v. 2013

Arquitecturas GPU v. 2013 v. 2013 Stream Processing Similar al concepto de SIMD. Data stream procesado por kernel functions (pipelined) (no control) (local memory, no cache OJO). Data-centric model: adecuado para DSP o GPU (image,

Más detalles

Clase 20: Arquitectura Von Neuman

Clase 20: Arquitectura Von Neuman http://computacion.cs.cinvestav.mx/~efranco @efranco_escom efranco.docencia@gmail.com Estructuras de datos (Prof. Edgardo A. Franco) 1 Contenido Arquitectura de una computadora Elementos básicos de una

Más detalles

15. Arquitectura de los multiprocesadores. 16. Multiprocesadores de memoria compartida. 17. Multicomputadores.

15. Arquitectura de los multiprocesadores. 16. Multiprocesadores de memoria compartida. 17. Multicomputadores. UNIDAD TEMÁTICA 5: MULTIPROCESADORES. 15. Arquitectura de los multiprocesadores. 16. Multiprocesadores de memoria compartida. 17. Multicomputadores. 15-1 TEMA 15: ARQUITECTURA DE LOS MULTIPROCESADORES.

Más detalles

ARQUITECTURA DE DISTRIBUCIÓN DE DATOS

ARQUITECTURA DE DISTRIBUCIÓN DE DATOS 4 ARQUITECTURA DE DISTRIBUCIÓN DE DATOS Contenido: Arquitectura de Distribución de Datos 4.1. Transparencia 4.1.1 Transparencia de Localización 4.1.2 Transparencia de Fragmentación 4.1.3 Transparencia

Más detalles

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas:

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas: SISTEMAS DISTRIBUIDOS DE REDES 1. SISTEMAS DISTRIBUIDOS Introducción y generalidades La computación desde sus inicios ha sufrido muchos cambios, desde los grandes equipos que permitían realizar tareas

Más detalles

Laboratorio Nacional de Cómputo de Alto Desempeño: Fortalecimiento de la Infraestructura 2015

Laboratorio Nacional de Cómputo de Alto Desempeño: Fortalecimiento de la Infraestructura 2015 Anexo A. Partida 3 Laboratorio Nacional de Cómputo de Alto Desempeño: Fortalecimiento de la Infraestructura 2015 CLUSTER LANCAD3 El bien a adquirir se describe a continuación y consiste en cúmulo de supercómputo

Más detalles

Introducción. TEMA 3: Clusters de Computadores Personales

Introducción. TEMA 3: Clusters de Computadores Personales Introducción TEMA 3: Clusters de Computadores Personales Laboratorio de Arquitecturas Avanzadas de Computadores 5º de Ingeniería Superior de Informática 2008/09 Alberto Sánchez alberto.sanchez@urjc.es

Más detalles

computadoras que tienen este servicio instalado se pueden publicar páginas web tanto local como remotamente.

computadoras que tienen este servicio instalado se pueden publicar páginas web tanto local como remotamente. Investigar Qué es un IIS? Internet Information Services o IIS es un servidor web y un conjunto de servicios para el sistema operativo Microsoft Windows. Originalmente era parte del Option Pack para Windows

Más detalles

Tecnología IP para videovigilancia... Los últimos avances han hecho posible conectar cámaras directamente a una red de ordenadores basada en el

Tecnología IP para videovigilancia... Los últimos avances han hecho posible conectar cámaras directamente a una red de ordenadores basada en el para videovigilancia....... Los últimos avances han hecho posible conectar cámaras directamente a una red de ordenadores basada en el protocolo IP. La tecnología de las cámaras de red permite al usuario

Más detalles

Colección de Tesis Digitales Universidad de las Américas Puebla. Morales Salcedo, Raúl

Colección de Tesis Digitales Universidad de las Américas Puebla. Morales Salcedo, Raúl 1 Colección de Tesis Digitales Universidad de las Américas Puebla Morales Salcedo, Raúl En este último capitulo se hace un recuento de los logros alcanzados durante la elaboración de este proyecto de tesis,

Más detalles

Global File System (GFS)...

Global File System (GFS)... Global File System (GFS)... Diferente a los sistemas de ficheros en red que hemos visto, ya que permite que todos los nodos tengan acceso concurrente a los bloques de almacenamiento compartido (a través

Más detalles

Redes de Altas Prestaciones

Redes de Altas Prestaciones Redes de Altas Prestaciones TEMA 3 Redes SAN -Alta disponibilidad -Sistemas Redundantes -Curso 2010 Redes de Altas Prestaciones - Indice Conceptos Componentes de un SAN Términos más utilizados Topología

Más detalles

Soluciones para entornos HPC

Soluciones para entornos HPC Dr.. IT Manager / Project Leader @ CETA-Ciemat abelfrancisco.paz@ciemat.es V Jornadas de Supercomputación y Avances en Tecnología INDICE 1 2 3 4 HPC Qué? Cómo?..................... Computación (GPGPU,

Más detalles

Arquitecturas DSP. Phil Lapsley, Jeff Bier, Amit Shoham, Edward A. Lee DSP Processor Fundamentals. Architectures and Features IEEE Press 1997

Arquitecturas DSP. Phil Lapsley, Jeff Bier, Amit Shoham, Edward A. Lee DSP Processor Fundamentals. Architectures and Features IEEE Press 1997 Arquitecturas DSP Phil Lapsley, Jeff Bier, Amit Shoham, Edward A. Lee DSP Processor Fundamentals. Architectures and Features IEEE Press 1997 Arquitecturas DSP Sistemas de procesamiento de señales Transductor

Más detalles

Introducción a Computación

Introducción a Computación Curso: Modelización y simulación matemática de sistemas Metodología para su implementación computacional Introducción a Computación Esteban E. Mocskos (emocskos@dc.uba.ar) Facultades de Ciencias Exactas

Más detalles

Redes de Altas Prestaciones

Redes de Altas Prestaciones Redes de Altas Prestaciones TEMA 3 Tecnologías Soporte tolerante a fallos -Curso 2010 Redes de Altas Prestaciones - Indice Conceptos Topología en Alta Disponibilidad Tecnologías disponibles Tecnología

Más detalles

Efectos de los dispositivos de Capa 2 sobre el flujo de datos 7.5.1 Segmentación de la LAN Ethernet

Efectos de los dispositivos de Capa 2 sobre el flujo de datos 7.5.1 Segmentación de la LAN Ethernet 7.5 Efectos de los dispositivos de Capa 2 sobre el flujo de datos 7.5.1 Segmentación de la LAN Ethernet 1 2 3 3 4 Hay dos motivos fundamentales para dividir una LAN en segmentos. El primer motivo es aislar

Más detalles

Figura 1.4. Elementos que integran a la Tecnología de Información.

Figura 1.4. Elementos que integran a la Tecnología de Información. 1.5. Organización, estructura y arquitectura de computadoras La Gráfica siguiente muestra la descomposición de la tecnología de información en los elementos que la conforman: Figura 1.4. Elementos que

Más detalles

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN Tabla de Contenidos LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN... 1 Tabla de Contenidos... 1 General... 2 Uso de los Lineamientos Estándares...

Más detalles

Evaluación del rendimiento de procesadores Intel Nehalem. Modelos x7550, x5670 y x5570

Evaluación del rendimiento de procesadores Intel Nehalem. Modelos x7550, x5670 y x5570 Evaluación del rendimiento de procesadores Intel Nehalem. Modelos x7550, x5670 y x5570 Juan Carlos Fernández Rodríguez. Área de HPC. Centro Informático Científico de Andalucía (CICA) Junta de Andalucía

Más detalles

Conclusiones. Particionado Consciente de los Datos

Conclusiones. Particionado Consciente de los Datos Capítulo 6 Conclusiones Una de las principales conclusiones que se extraen de esta tesis es que para que un algoritmo de ordenación sea el más rápido para cualquier conjunto de datos a ordenar, debe ser

Más detalles

Clusters en Linux. * Jorge Castellanos - jorcas@cantv.net ** Julio Ortega - roliverio@cantv.net. * FACYT-UC Computación ** IUPSM Sistemas

Clusters en Linux. * Jorge Castellanos - jorcas@cantv.net ** Julio Ortega - roliverio@cantv.net. * FACYT-UC Computación ** IUPSM Sistemas Clusters en Linux * Jorge Castellanos - jorcas@cantv.net ** Julio Ortega - roliverio@cantv.net * FACYT-UC Computación ** IUPSM Sistemas www.vaslibre.org.ve Agenda Motivación Definiciones Cluster Beowulf

Más detalles

Sistemas Operativos Windows 2000

Sistemas Operativos Windows 2000 Sistemas Operativos Contenido Descripción general 1 Funciones del sistema operativo 2 Características de 3 Versiones de 6 Sistemas Operativos i Notas para el instructor Este módulo proporciona a los estudiantes

Más detalles

Arquitecturas CISC y RISC

Arquitecturas CISC y RISC Arquitecturas CISC y RISC Diseño de Sistemas Digitales EL-3310 I SEMESTRE 2008 2. ARQUITECTURA DEL CONJUNTO DE INSTRUCCIONES 2.1 Elementos de la arquitectura Clasificación de la arquitectura Organización

Más detalles

Introducción Subsistemas de disco inteligentes Técnicas de entrada y salida. Storage. Esteban De La Fuente Rubio SASCO. 7 de noviembre de 2013

Introducción Subsistemas de disco inteligentes Técnicas de entrada y salida. Storage. Esteban De La Fuente Rubio SASCO. 7 de noviembre de 2013 SASCO 7 de noviembre de 2013 Tabla de contenidos 1 Introducción Arquitectura de servidor central Arquitectura de almacenamiento central 2 JBOD RAID 3 SCSI Fibre Channel SAN IP Introducción Arquitectura

Más detalles

JAVA EE 5. Arquitectura, conceptos y ejemplos.

JAVA EE 5. Arquitectura, conceptos y ejemplos. JAVA EE 5. Arquitectura, conceptos y ejemplos. INTRODUCCIÓN. MODELO DE LA APLICACIÓN JEE5. El modelo de aplicación Java EE define una arquitectura para implementar servicios como lo hacen las aplicaciones

Más detalles

Características del software

Características del software Características del software Descripción general de Fierro Fierro resuelve la operatoria diaria y la problemática de librerías y editoriales. Fierro fue gestado por gente que conoce el mercado del libro,

Más detalles

COMO CONFIGURAR UNA MAQUINA VIRTUAL EN VIRTUALBOX PARA ELASTIX

COMO CONFIGURAR UNA MAQUINA VIRTUAL EN VIRTUALBOX PARA ELASTIX COMO CONFIGURAR UNA MAQUINA VIRTUAL EN VIRTUALBOX PARA ELASTIX En este manual se presenta el proceso de configuración de una Maquina Virtual en VirtualBox, que será utilizada para instalar un Servidor

Más detalles

Familia de Windows Server 2003

Familia de Windows Server 2003 Familia de Windows Server 2003 Windows Server 2003 está disponible en cuatro ediciones. Cada edición se ha desarrollado para una función de servidor específica, como se describe en la tabla siguiente:

Más detalles

Windows Server 2012: Infraestructura de Escritorio Virtual

Windows Server 2012: Infraestructura de Escritorio Virtual Windows Server 2012: Infraestructura de Escritorio Virtual Módulo 1: Application Virtualization Módulo del Manual Autores: James Hamilton-Adams, Content Master Publicado: 5 de Octubre 2012 La información

Más detalles

CLUSTERS. Antonio Antiñolo Navas ESI-UCLM. Antonio.Antinolo@uclm.es. Profesor: Serafín Benito Santos. Arquitectura e Ingeniería de Computadores

CLUSTERS. Antonio Antiñolo Navas ESI-UCLM. Antonio.Antinolo@uclm.es. Profesor: Serafín Benito Santos. Arquitectura e Ingeniería de Computadores CLUSTERS Antonio Antiñolo Navas Antonio.Antinolo@uclm.es 1 Arquitectura e Ingeniería de Computadores Profesor: Serafín Benito Santos ESI-UCLM Índice 1. Introducción. 2. Clasificación. 3. Ventajas y Desventajas.

Más detalles

CLUSTER FING: PARALELISMO de MEMORIA DISTRIBUIDA

CLUSTER FING: PARALELISMO de MEMORIA DISTRIBUIDA CLUSTER FING: PARALELISMO de MEMORIA DISTRIBUIDA SERGIO NESMACHNOW Centro de Cálculo, Instituto de Computación FACULTAD DE INGENIERÍA, UNIVERSIDAD DE LA REPÚBLICA, URUGUAY CONTENIDO Introducción: arquitecturas

Más detalles

TEMA 4. Unidades Funcionales del Computador

TEMA 4. Unidades Funcionales del Computador TEMA 4 Unidades Funcionales del Computador Álvarez, S., Bravo, S., Departamento de Informática y automática Universidad de Salamanca Introducción El elemento físico, electrónico o hardware de un sistema

Más detalles

Pipelining o Segmentación de Instrucciones

Pipelining o Segmentación de Instrucciones Pipelining o Segmentación de Instrucciones La segmentación de instrucciones es similar al uso de una cadena de montaje en una fábrica de manufacturación. En las cadenas de montaje, el producto pasa a través

Más detalles

OBJETIVOS DE LA MATERIA... 4 PROGRAMA ANALÍTICO. CONTENIDOS TEÓRICOS Y PRÁCTICOS... 5 BIBLIOGRAFIA... 7

OBJETIVOS DE LA MATERIA... 4 PROGRAMA ANALÍTICO. CONTENIDOS TEÓRICOS Y PRÁCTICOS... 5 BIBLIOGRAFIA... 7 UNIVERSIDAD NACIONAL DE LA MATANZA DEPARTAMENTO DE INGENIERIA E INVESTIGACIONES TECNOLOGICAS INGENIERIA EN INFORMATICA ARQUITECTURA DE COMPUTADORAS (1109) Profesor Titular: Ing. Fernando I. Szklanny PLANIFICACIÓN

Más detalles

1.2 Análisis de los Componentes. Arquitectura de Computadoras Rafael Vazquez Perez

1.2 Análisis de los Componentes. Arquitectura de Computadoras Rafael Vazquez Perez 1.2 Análisis de los Componentes. Arquitectura de Computadoras Rafael Vazquez Perez 1.2.1 CPU 1 Arquitecturas. 2 Tipos. 3 Características. 4 Funcionamiento(ALU, unidad de control, Registros y buses internos)

Más detalles

picojava TM Características

picojava TM Características picojava TM Introducción El principal objetivo de Sun al introducir Java era poder intercambiar programas ejecutables Java entre computadoras de Internet y ejecutarlos sin modificación. Para poder transportar

Más detalles

SISTEMAS OPERATIVOS II

SISTEMAS OPERATIVOS II SISTEMAS OPERATIVOS II INSTITUTO TECNOLÓGICO DE MORELIA Unidad I: Sistemas Operativos en ambientes Distribuidos Departamento de Sistemas y Computación M.C. Benito Sánchez Raya sanchezraya@hotmail.com Disponible

Más detalles

PVFS (Parallel Virtual File System)

PVFS (Parallel Virtual File System) Sergio González González Instituto Politécnico de Bragança, Portugal sergio.gonzalez@hispalinux.es Jónatan Grandmontagne García Universidad de Bragança, Portugal thestalker44@hotmail.com Breve explicación

Más detalles

ARC 101 Architecture Overview Diagram

ARC 101 Architecture Overview Diagram ARC 101 Architecture Overview Diagram Estudio de Arquitectura para la evolución tecnológica de los aplicativos de ATyR Banco de Previsión Social ATYR Evolución Tecnológica Pág 1 of 10 Tabla de Contenidos

Más detalles

ESCUELA NORMAL PROF. CARLOS A CARRILLO

ESCUELA NORMAL PROF. CARLOS A CARRILLO ESCUELA NORMAL PROF. CARLOS A CARRILLO QUE ES UNA RED L A S T I C S E N L A E D U C A C I O N P R E E S C O L A R P R O F. C R U Z J O R G E A R A M B U R O A L U M N A : D U L C E C O R A Z Ó N O C H

Más detalles

Tema 1 Introducción. Arquitectura básica y Sistemas Operativos. Fundamentos de Informática

Tema 1 Introducción. Arquitectura básica y Sistemas Operativos. Fundamentos de Informática Tema 1 Introducción. Arquitectura básica y Sistemas Operativos Fundamentos de Informática Índice Descripción de un ordenador Concepto básico de Sistema Operativo Codificación de la información 2 1 Descripción

Más detalles

La Arquitectura de las Máquinas Virtuales.

La Arquitectura de las Máquinas Virtuales. La Arquitectura de las Máquinas Virtuales. La virtualización se ha convertido en una importante herramienta en el diseño de sistemas de computación, las máquinas virtuales (VMs) son usadas en varias subdiciplinas,

Más detalles

BUSES. Una comunicación compartida Un conjunto de cables para comunicar múltiples subsistemas. Memoria

BUSES. Una comunicación compartida Un conjunto de cables para comunicar múltiples subsistemas. Memoria BUSES UPCO ICAI Departamento de Electrónica y Automática 1 Qué es un bus? Una comunicación compartida Un conjunto de cables para comunicar múltiples subsistemas Procesador Control Datapath Memoria Entrada

Más detalles

Componentes de Integración entre Plataformas Información Detallada

Componentes de Integración entre Plataformas Información Detallada Componentes de Integración entre Plataformas Información Detallada Active Directory Integration Integración con el Directorio Activo Active Directory es el servicio de directorio para Windows 2000 Server.

Más detalles

Arquitectura de Software

Arquitectura de Software Arquitectura de Software (Estilos Arquitectónicos) Universidad de los Andes Demián Gutierrez Mayo 2011 1 Diseño Arquitectónico Diseño Arquitectónico Arquitectura del Software Estilos Arquitectónicos Frameworks

Más detalles

REDES INFORMÁTICAS REDES LOCALES. Tecnología de la Información y la Comunicación

REDES INFORMÁTICAS REDES LOCALES. Tecnología de la Información y la Comunicación REDES INFORMÁTICAS REDES LOCALES INDICE 1. Las redes informáticas 1.1 Clasificación de redes. Red igualitaria. Red cliente-servidor 2. Las redes de área local 2.1 Estructura de una LAN 2.2 Protocolos de

Más detalles

Permite compartir recursos en forma coordinada y controlada para resolver problemas en organizaciones multiinstitucionales

Permite compartir recursos en forma coordinada y controlada para resolver problemas en organizaciones multiinstitucionales The Anatomy of the Grid Enabling Scalable Virtual Organization Autores : Ian Foster, Carl Kesselman y Steven Tuecke. 2001 GRIDS y Organizaciones Virtuales Permite compartir recursos en forma coordinada

Más detalles

Intel Tera-Scale Computing Alumno: Roberto Rodriguez Alcala

Intel Tera-Scale Computing Alumno: Roberto Rodriguez Alcala Intel Tera-Scale Computing Alumno: Roberto Rodriguez Alcala 1. Introducción Los procesadores con dos núcleos existen actualmente, y los procesadores de cuatro están insertándose en el mercado lentamente,

Más detalles

Tema 5 Repertorios de instrucciones: Modos de direccionamiento y formato

Tema 5 Repertorios de instrucciones: Modos de direccionamiento y formato Tema 5 Repertorios de instrucciones: Modos de direccionamiento y formato Bibliografía: William Stallings Organización y Arquitectura de computadores 5ta. Edition. Editorial Pearson Educación.- Objetivos:

Más detalles

Medellín, martes 27 de octubre del 2015

Medellín, martes 27 de octubre del 2015 Medellín, martes 27 de octubre del 2015 José Flavio Guerra Gerente de Innovación OasisCom Introducción Administre con eficiencia sus recursos Servicios En la nube? ERP? Nada? Contenido ERP Definición Características

Más detalles

Seminario Electrónico de Soluciones Tecnológicas sobre Ethernet de Largo Alcance

Seminario Electrónico de Soluciones Tecnológicas sobre Ethernet de Largo Alcance Seminario Electrónico de Soluciones Tecnológicas sobre Ethernet de Largo Alcance 1 de 12 Seminario Electrónico de Soluciones Tecnológicas sobre Ethernet de Largo Alcance 3 Bienvenida. 4 Objetivos. 5 Requerimientos

Más detalles

Procesador Pentium II 450 MHz Procesador Pentium II 400 MHz Procesador Pentium II 350 MHz Procesador Pentium II 333 MHz Procesador Pentium II 300 MHz

Procesador Pentium II 450 MHz Procesador Pentium II 400 MHz Procesador Pentium II 350 MHz Procesador Pentium II 333 MHz Procesador Pentium II 300 MHz PENTIUM El procesador Pentium es un miembro de la familia Intel de procesadores de propósito general de 32 bits. Al igual que los miembros de esta familia, el 386 y el 486, su rango de direcciones es de

Más detalles

1.- FUNCION DE UNA RED INFORMATICA

1.- FUNCION DE UNA RED INFORMATICA 1.- FUNCION DE UNA RED INFORMATICA Una red de computadoras, también llamada red de ordenadores, red de comunicaciones de datos o red informática, es un conjunto de equipos informáticos y software conectados

Más detalles

Laboratorio Nacional de Cómputo de Alto Desempeño: Fortalecimiento de la Infraestructura 2015

Laboratorio Nacional de Cómputo de Alto Desempeño: Fortalecimiento de la Infraestructura 2015 Anexo A. Partida 2 Laboratorio Nacional de Cómputo de Alto Desempeño: Fortalecimiento de la Infraestructura 2015 CLUSTER LANCAD 2 El bien a adquirir se describe a continuación y consiste de un cúmulo de

Más detalles

Windows Server 2003. Windows Server 2003

Windows Server 2003. Windows Server 2003 Windows Server 2003 Windows Server 2003 Es un sistema operativo de la familia Windows de la marca Microsoft para servidores que salió al mercado en el año 2003. Está basada en tecnología NT y su versión

Más detalles

Memoria Compartida Distribuida (DSM) Sistema de Archivos

Memoria Compartida Distribuida (DSM) Sistema de Archivos Memoria Compartida Distribuida (DSM) La memoria compartida distribuida es una abstracción que se propone como alternativa a la comunicación por mensajes. Memoria compartida basada en páginas: este esquema

Más detalles

Introducción. Sistemas Operativos. Pedro Chávez Lugo mailto:pchavezl74@gmail.com. 23 de marzo de 2010

Introducción. Sistemas Operativos. Pedro Chávez Lugo mailto:pchavezl74@gmail.com. 23 de marzo de 2010 mailto:pchavezl74@gmail.com 23 de marzo de 2010 1 Introducción Que es un Sistema Operativo? Un sistema operativo es un programa que tiene la finalidad de simplificar el manejo y la utilización de la computadora.

Más detalles

Ventajas del almacenamiento de datos de nube

Ventajas del almacenamiento de datos de nube Ventajas del almacenamiento de datos de nube Almacenar grandes volúmenes de información en una red de área local (LAN) es caro. Dispositivos de almacenamiento electrónico de datos de alta capacidad como

Más detalles

Arquitectura de sistema de alta disponibilidad

Arquitectura de sistema de alta disponibilidad Mysql Introducción MySQL Cluster esta diseñado para tener una arquitectura distribuida de nodos sin punto único de fallo. MySQL Cluster consiste en 3 tipos de nodos: 1. Nodos de almacenamiento, son los

Más detalles

Javier Pérez Mato µp para Comunicaciones Curso 2008/09 ETSIT - ULPGC

Javier Pérez Mato µp para Comunicaciones Curso 2008/09 ETSIT - ULPGC Javier Pérez Mato µp para Comunicaciones Curso 2008/09 ETSIT - ULPGC INTRODUCCIÓN HPC: High Performance Computer System Qué es un supercomputador? Computador diseñado para ofrecer la mayor capacidad de

Más detalles

Seminario Electrónico de Soluciones Tecnológicas sobre Content Networking

Seminario Electrónico de Soluciones Tecnológicas sobre Content Networking Seminario Electrónico de Soluciones Tecnológicas sobre Content Networking 1 de 13 Seminario Electrónico de Soluciones Tecnológicas sobre Content Networking 3 Bienvenida. 4 Objetivos. 5 Soluciones comerciales

Más detalles

Version 3. Capítulo 9. Fundamentos de hardware avanzado para servidores

Version 3. Capítulo 9. Fundamentos de hardware avanzado para servidores Capítulo 9 Fundamentos de hardware avanzado para servidores Servidores para redes Un servidor es un computador en una red que es compartido por múltiples usuarios. El término servidor se refiere al hardware

Más detalles

Módulo: Modelos de programación para Big Data

Módulo: Modelos de programación para Big Data Program. paralela/distribuida Módulo: Modelos de programación para Big Data (título original: Entornos de programación paralela basados en modelos/paradigmas) Fernando Pérez Costoya Introducción Big Data

Más detalles

INDICE. Reconocimientos Introducción Parte I Planeación de su cluster MSCS

INDICE. Reconocimientos Introducción Parte I Planeación de su cluster MSCS INDICE Reconocimientos xvii Introducción xix Parte I Planeación de su cluster MSCS 3 1 Una introducción a los clusters y a la tecnología de conformación de clústeres Pioneros en la conformación de clústeres

Más detalles

Servicios avanzados de supercomputación para la ciència y la ingeniería

Servicios avanzados de supercomputación para la ciència y la ingeniería Servicios avanzados de supercomputación para la ciència y la ingeniería Servicios avanzados de supercomputación para la ciència y la ingeniería HPCNow! provee a sus clientes de la tecnología y soluciones

Más detalles

COMPUTADORES MULTINUCLEO. Stallings W. Computer Organization and Architecture 8ed

COMPUTADORES MULTINUCLEO. Stallings W. Computer Organization and Architecture 8ed COMPUTADORES MULTINUCLEO Stallings W. Computer Organization and Architecture 8ed Computador multinucleo Un computador multinúcleocombina dos o mas procesadores (llamados núcleos) en una única pieza de

Más detalles

Introducción a las Redes

Introducción a las Redes Introducción a las Redes Tabla de Contenidos 1. Introducción a las Redes... 2 1.1 Clasificación de las redes y topología... 3 1.1.1 Según su distribución...3 1.1.2 Según su tamaño...6 1. Introducción a

Más detalles

ADMINISTRACIÓN CENTRALIZADA DELL POWERVAULT DL2000 CON TECNOLOGÍA SYMANTEC

ADMINISTRACIÓN CENTRALIZADA DELL POWERVAULT DL2000 CON TECNOLOGÍA SYMANTEC ADMINISTRACIÓN CENTRALIZADA DELL POWERVAULT DL2000 CON TECNOLOGÍA SYMANTEC RESUMEN EJECUTIVO Es un método ideal para que cualquier departamento de TI logre realizar respaldos y restauraciones más rápidas

Más detalles

Redes Computacionales

Redes Computacionales Redes Computacionales 1 Modelo de comunicación simplificado Disp Entrada 2 Datos de entrada (g) o señal g(t) Transmisor Medio de Transmisión Receptor 1 6 Información de entrada (m) Agente 3 Señal Transmitida

Más detalles

Sistemas. Distribuidos

Sistemas. Distribuidos Sistemas Distribuidos a los Sistemas Distribuidos Lima, enero 2009 Ing Roberto Montero Flores pcsirmon@upc.edu.pe Pag. 1 AGENDA A) Definiciones B) Utilización Internet Intranet Computación n móvilm C)

Más detalles

RAID 0 : No redundante

RAID 0 : No redundante RAID ECP RAID RAID - Redundant Array of Independent Discs, 1987 Combinar varios discos, pequeños y baratos, en un sólo dispositivo lógico de disco y distribuir los datos a través de las unidades físicas

Más detalles