Departament d Arquitectura de Computadors Conceptos generales de sistemas distribuidos Sistema distribuido Un sistema en el que los componentes hardware y/o software ubicados en computadores en red, se comunican y coordinan sus acciones intercambiando mensajes. Coulouris Colección de ordenadores autónomos enlazados por una red y soportados por aplicaciones que hacen que la colección actúe como un servicio integrado 2
Conceptos (I) Proceso: Programa que se ejecuta en una máquina. En muchas máquinas pueden ejecutarse varios procesos a la vez. Agente: Proceso conectado a la red. En ocasiones se denomina "agente" a un proceso que actúa sin control directo del usuario, y que puede presentarse a la red como un usuario. : Proceso que puede establecer conexiones a servidores y enviar peticiones a él. Agente de usuario: que representa al usuario. A menudo tienen interface de usuario, para que las personas puedan controlarlo directamente. Servicio: Parte de un sistema de computadores que gestiona una colección de recursos y presenta una funcionalidad a los usuarios y a las aplicaciones. 3 Conceptos (II) : proceso que acepta conexiones de clientes y realiza servicios para ellos. Un servidor puede atender varias peticiones simultáneas de varios clientes (1 o varios procesos, uno para cada cliente). Host: máquina conectada a la red que proporciona servicios. El mismo hostpuede tener varios procesos servidor que proporcionen diversos servicios. Agente Usuario 1-n procesos PC Conexión Host 4
Por qué sistemas distribuidos? Funcionales: los computadores tienen diferentes funcionalidades. Ejemplo: terminales/servidor. Distribución del trabajo: los computadores se reparten el trabajo. Ejemplo: SETI@home Económicos: es más barato muchos ordenadores pequeños que pocos muy grandes. Ejemplo: Cluster distribuido (0,5 millones $) ~ ASCI While IBM (110 millones $) Físicos: dispersos geográficamente. Ejemplo estaciones meteorológicas. 5 Arquitecturas cliente/servidor Distribución de sistemas en diferentes nodos y como se comunican entre sí. p p1 p2 p1 p2 p1 Encadenado, recursivo Referencia, iterativo Multicast, difusión 6
Otras arquitecturas Descentralizado ~ Peer to Peer P2P Dispositivos móviles Agentes móviles s Thin + 7 Desafíos de un SD (I) Heterogeneidad: computadores, SO, redes, lenguajes de programación,... Windows/Linux/Mac/... o C/Java/... Extensibilidad: sistema abierto, estándares públicos. Navegar? TCP/IP y Visualizador HTML Seguridad: confidencialidad, integridad, autenticación Quién es? Alguién ha cambiado la información? Escalabilidad: el sistema puede crecer. Podríamos conectarnos todos a Internet? 8
Desafíos de un SD (II) Tolerancia a fallos: ante un fallo el resto del sistema sigue funcionando. Deja de funcionar Internet si falla mi ordenador? y si falla Terra? Concurrencia de los sistemas y procesos Qué pasa si consultamos todos una misma web? Transparencia: el usuario y los programas ven al sistema como un todo. Dónde está un servidor web? Por dónde se pasa para llegar? No existe el reloj universal Todos los ordenadores tienen la misma hora? 9 Desafíos: Heterogeneidad y Transparencia en redes en sistemas distribuidos Nivel aplicación Nivel Transporte (TCP,UDP,RTP) Middleware Nivel IP Sistema Operativo Nivel Físico Hardware 10
Desafíos: Escalabilidad Que un mecanismo pueda funcionar en entornos pequeños o globales (número de máquinas, distancia, ancho de banda, capacidad, etc.) Autonomía: número de mensajes Distancia: temporizadores adaptables, concurrencia N(N-1) msg O(N 2 ) Cómo hacer que un sistema sea escalable? Caché: ahorro al guardar copias por el camino Distribución: repartir servicio entre servidores separados. Replicación: ofrecer el mismo servicio desde varios lugares. 11 Desafíos: Concurrencia Exclusión mutua Acceso a una zona crítica, ejemplo un fichero compartido accediendo para modificarlo. Centralizado: un servidor centraliza el acceso. Anillo: paso de un token. Multicast: espera confirmación de todos. Quórum: espera confirmación de algunos. 12
Desafíos: no Reloj universal Caracterización Iteración Latencia es el tiempo que tarda un dato en estar disponible desde que se realiza su petición. Throughput Flujo de datos de entrada o salida en una aplicación Síncrona Asíncrona 13 Desafíos: no Reloj universal Tiempo? Sincronizar un reloj Reloj = Marca + f(latencia) Orden? Causalidad? 14
Referencias Coulouris, G., J. Dollymore y T. Kindberg. Sistemas Distribuidos: Conceptos y Diseño. Addison-Wesley, 3 edition, 2001 Capítulo 1: Caracterización Sistemas Distribuidos Capítulo 2: Modelos de sistema Capítulo 10: Tiempo y estados globales Capítulo 11: Coordinación y acuerdo Capítulo 12: Transacciones y control de concurrencia Capítulo 13: Transacciones distribuidas Capítulo 14: Replicación 15