Universidad Simón Bolívar Arquitectura: Clusters Integrantes: - Aquilino Pinto - Alejandra Preciado
Definición Conjuntos o conglomerados de computadoras construidos mediante la utilización de hardware comunes y que se comportan como si fuesen una única computadora. Entre sus usos están: Aplicaciones de súper cómputo y software de misiones críticas. Servidores web y comercio electrónico. Bases de datos de alto rendimiento.
Definición Simplemente, un clúster es un grupo de múltiples ordenadores unidos mediante una red de alta velocidad, de tal forma que el conjunto es visto como un único ordenador, más potente que los comunes de escritorio.
Características Consta de dos o más nodos, que se conectan entre sí por un canal de comunicación funcional. Necesitan software especializado Software a nivel de aplicación Software a nivel de sistema Todos los elementos del cluster trabajan para cumplir una funcionalidad conjunta. Mejora la disponibilidad Mejora el rendimiento
Características l Poseen una forma de acoplamiento: l Fuerte: software cuyos elementos se interrelacionan mucho unos con otros, y hacen las funcionalidades del cluster de manera cooperativa. l Medio: software que no necesita un conocimiento tan exhaustivo de todos los recursos de otros nodos, pero que sigue usando el software de otros nodos para aplicaciones de muy bajo nivel. l Débil: los programas se dividen en diversos nodos y por tanto se necesitan pero que no están a un nivel tan bajo.
Características De un clúster se espera las combinaciones de los siguientes servicios: Alta disponibilidad Alto rendimiento Balanceo de carga Escalabilidad
Alta Disponibilidad Configuración con la cual el cluster es capaz de mantener la operación de sus servicios. Se puede clasificar como : Alta disponibilidad de infraestructura: En el caso de fallos en algunas de las maquinas. Alta disponibilidad de aplicación: En el caso de fallos en la ejecucion de una aplicacion en alguna de las maquinas. En ambas clases se garantiza la continuación en la ejecución de los servicios detenidos, por medio de la migración de estos a otras maquinas.
Alto Rendimiento Configuración del cluster con la cual se busca proporcionar una gran capacidad de computo, los motivos para usarlo son: El tamaño del problema por resolver El precio de la máquina necesaria para resolverlo. Para sacar el máximo potencial de un cluster, es necesario que los problemas que se le piden resolver sean paralelizables, esto con la finalidad de aprovechar el procesamiento en diferentes nodos.
Balanceo de Carga Es la Capacidad que posee el cluster de distribuir, de la mejor manera posible, el conjunto de tareas que debe realizar, entre las maquinas que los conforman. Pueden usar diferentes estrategias para lograrlo entre ellas round-robin o planificador basado en pesos (a los Nodos). Balance de carga en servidores web Este servicio se puede brindar tanto con un enrutador como con una computadora con dos placas de red y software específico. Algunas soluciones son LVS y Red Hat Piranha.
Arquitectura Nodos Ordenadores Dedicados. Ordenadores No Dedicados. Software de base Sistemas operativos (linux-openmosix, windowserver*). Comunicaciones: Redes de alta velocidad ( Fast Ethernet, Myrinet). Interfaces y software para comunicaciones Middleware (entre SO y aplicaciones) Gestores de ejecución, monitores de recursos, etc. Almacenamiento NAS, DAS o Almacenamiento interno en el servidor. Protocolo mas popular es NFS
Arquitectura
Tipos de Cluster Existen tres tipos de clústers: Clusters de alto rendimiento Clusters de Alta disponibilidad Clusters de Alta Eficiencia Los clusters pueden también clasificar como Clusters Comerciales y Científicos.
Tipo Científico Clusters de Alto Rendimiento (HPCC - High Performance Computing Clusters): Se ejecutan tareas que requieren de gran capacidad computacional, grandes cantidades de memoria, o ambos a la vez. El llevar a cabo estas tareas puede comprometer los recursos del clúster por largos periodos de tiempo.
Tipo Comercial Clusters de Alta Disponibilidad (HA o HACC High Availability Computing Clusters): Proveer disponibilidad y confiabilidad. Tratan de brindar la máxima disponibilidad de los servicios que ofrecen. La confiabilidad se provee mediante software que detecta fallos y permite recuperarse frente a los mismos, mientras que en hardware se evita tener un único punto de fallos.
Tipo Comercial Clusters de Alta Eficiencia (HT o HTCC - High Throughput Computing Clusters): Ejecutar la mayor cantidad de tareas en el menor tiempo posible. Existe independencia de datos entre las tareas individuales. El retardo entre los nodos del clúster no es considerado un gran problema.
Ventajas Alta capacidad de procesamiento. Consolidación de recursos. Uso óptimo de los recursos. Consolidación geográfica del servidor. Disponibilidad 24 x 7 con protección de failovers. Recuperación de desastres. Escalabilidad horizontal y vertical sin tiempo de inactividad.
Desventajas Las principales desventajas del Cluster, son: Escalan mal para aplicaciones transaccionales (bases de datos, por ejemplo). La administración de muchas maquinas interconectadas implica una mayor atención y conocimiento que la administración de una gran maquina con muchos procesadores. No va a ser tan veloz como una 'supercomputadora', aunque tenga la misma memoria y numero de procesadores similares.
Referencias https://www.centos.org/docs/5/html/cluster_suite_ove rview/s1-rhcs-intro-cso.html https://sites.google.com/site/sistemasdistribuidosyclu ster/clusters http://www.fing.edu.uy/cluster/grupo/cluster_arquitect ura_y_aplicaciones.pdf