Reemplazo de una Supervisora en un Sistema de Conmutación Virtual (VSS) por Haihua Rong 1
Tabla de contenidos Introducción... 3 Escenarios... 4 Escenario 1: Falla Chasis standy... 4 Escenario 2: Falla Chasis Activo... 6 Escenario 3: Falla en Ambos Chasis... 9 Conclusión... 12 Bibliografía... 13 2
Introducción Como todos sabemos VSS es una tecnología que permite que dos chasis se integren como una entidad virtual y permite escalabilidad, administración y alta disponibilidad. Dicha tecnología busca de alguna forma reducir un alto impacto a las operaciones de una compañía cuando sufre una falla nuestro núcleo al no tener una buena redundancia en la red. Sin embargo no siempre se puede prever situaciones que están fuera de nuestro control o situaciones inesperadas que causan una falla en el núcleo con nuestro dos 6500 en VSS. Por ello este documento viene de alguna forma a mostrar algunos posibles escenarios de falla en el equipo y como reemplazar dicho hardware defectuoso de una forma práctica y sencilla sin causar una mayor ruptura en las operaciones diarias. En este documento no se va tratar reemplazos de chasis con doble supervisora o problemas de redundancia cuando hay una diferencia entre la configuración del activo y standby. 3
Escenarios Escenario 1: Falla Chasis standy Este escenario es el más fácil de todos. Se tiene VSS con una supervisora en cada chasis y uno de ellos falló Activo Standby En este escenario la supervisora en el standby chasis sufre una falla y se ocupa un reemplazo. Los pasos son muy sencillos y se requieren 3 no obstante lo relevante de este escenario es tener BIEN claro los siguientes aspectos: Tener total seguridad/conocimiento del chasis que fallo (activo o standby) Tener claro que número del identificador del switch que falló (1 o 2) Se ocupa la configuración mas reciente del 6500 en VSS Al tener claro los puntos antes mencionados se procede a realizar el remplazo de la supervisora que falló y de las cuales detallo paso a paso y para este escenario se utilizará switch id 1 para el standby y switch id 2 para el activo (COMO un simple ejemplo, no necesariamente va a ser el mismo caso) 4
Paso 1: Verificar en el chasis activo el identificador del switch (switch_id): VSS#switch read switch_num local Read switch_num from Active rommon is 2 Como se puede observar el chasis activo tiene un identificador de 2 y por ende nuestro chasis standby tiene como id 1. Sabiendo cual es el número de identificador de mi chasis activo continuamos con el paso 2 Paso 2 Para una mejor práctica (no indispensable ) se debe de remover el VSL link. Se remueve la supervisora defectuosa y se introduce la de reemplazo. Se debe de copiar la imagen existente y la configuración más reciente de mi 6500 VSS. Para ello se ocupa una tarjeta compacta Cisco para pasar dicha información a la supervisora de reemplazo si no se tiene se configura un routed port en el chasis que fallo para poder conectar una laptop/pc con un servidor de TFTP y así transferir el IOS y la configuración. VSS#copy run disk0: VSS#copy sup-bootdisk:<ios> disk0: Paso 3 Se debe de transferir la image en la misma memoria que el activo, ya sea en el sup-bootdisk, disk0, disk1, etc y la configuración en la NVRAM y no en la running-config. Esto debido a que el switch de reemplazo no está en modo virtual y por ende nos va a dar error toda la configuración cuando se pasa por error en la memoria volátil. Con tarjeta compacta: SupervisoraReemplazo#copy disk0:<ios> <sup-bootdisk> SupervisoraReemplazo#copy disk0:<vss_config> startup-config 5
Paso 4 Después de darle un reload se debe de conectar el VSL link. Se procede a reiniciar la supervisor de reemplazo sin salvar los cambios que se han hecho esto debido a que vamos le vamos a caerle encima la running-config en blanco a la startup y por consiguiente el VSS no se va a formar. SupervisoraReemplazo #reload System configuration has been modified. Save? [yes/no]: no A este punto la supervisora de reemplazo va a detectar la configuración virtual y va a iniciarse como chasis standby esto debido a que ya existe un chasis activo para nuestro ambiente VSS. El activo detecta el standby e inicia los 3 pasos para la inicialización del VSL. Escenario 2: Falla Chasis Activo Se tiene VSS con una supervisora en cada chasis y uno de ellos falló pero el que fallo tenía como switch_id 2 Activo Standby En este escenario la supervisora en el chasis activo sufre una falla y se ocupa un reemplazo. Igual se debe de tener BIEN claro los siguientes aspectos: Tener total seguridad/conocimiento del chasis que fallo (activo o standby) Tener claro que numero del identificador del switch que falló (1 o 2) Se ocupa la configuración mas reciente del 6500 en VSS Para ejemplo el chasis activo tiene identificador de switch 2. 6
Paso 1: Verificar en el chasis activo el identificador del switch (switch_id): VSS#switch read switch_num local Read switch_num from Active rommon is 1 Como se puede observar el chasis activo tiene un identificador de 1. Sabiendo cual es el número de identificador de mi chasis activo continuamos con el paso 2 Paso 2 Para una mejor práctica (no indispensable) se debe de remover el VSL link. Se remueve la supervisora defectuosa y se introduce la de reemplazo. Se debe de copiar la imagen existente y la configuración más reciente de mi 6500 VSS. Para ello se ocupa una tarjeta compacta Cisco para pasar dicha información a la supervisora de reemplazo si no se tiene se configura un routed port en el chasis que fallo para poder conectar una laptop/pc con un servidor de TFTP y así transferir el IOS y la configuración. VSS#copy run disk0: VSS#copy sup-bootdisk:<ios> disk0: Paso 3 Se debe de transferir la imagen en la misma memoria que el activo, ya sea en el sup-bootdisk, disk0, disk1, etc y la configuración en la NVRAM y no en la running-config. Esto debido a que el switch de reemplazo no está en modo virtual y por ende nos va a dar error toda la configuración cuando se pasa por error en la memoria volátil. Con tarjeta compacta: SupervisoraReemplazo#copy disk0:<ios> <sup-bootdisk> SupervisoraReemplazo#copy disk0:<vss_config> startup-config 7
Paso 4 Se procede a cambiar el identificador del switch (switch_id) esto debido a QUE TODA SUPERVISORA VIENE POR DEFECTO con identificador 1 y el chasis que fallo tenía número 2 SupervisoraReemplazo #switch read switch_num local Read switch_num from Active rommon is 1 SupervisoraReemplazo # switch set switch_num 2 local (el local se puede omitir) Set rommon's switch_num to 2 Confirmar el cambio: SupervisoraReemplazo #switch read switch_num local Read switch_num from Active rommon is 2 Paso 5 Se reinicia la supervisora de reemplazo e igual NO SE SALVA LA CONFIGURACIóN System configuration has been modified. Save? [yes/no]: no Después de darle un reload se debe de conectar el VSL link. A este punto la supervisora de reemplazo va a detectar la configuración virtual y va a iniciarse como chasis standby porque el activo tiene identificador numero 1. Si no se hubiera cambiado el identificador lo que va a pasar es que va a haber un escenario activo doble y para resolverlo SE DEBE de desconectar el VSL link y mandar la supervisora en rommon y cambiar el identificador y reload de nuevo. 8
Escenario 3: Falla en Ambos Chasis Se tiene VSS con una supervisora en cada chasis y ambos fallaron. Podemos utilizar dos posibles soluciones. Activo Standby En este escenario es un poco complicado pero poco posible. Ambas supervisoras fallaron y se deben de reemplazar. Ya teniendo las supervisoras nuevas se procede con los siguientes pasos. Nota: Debemos de tener una configuración de respaldo o al menos la más actual de lo contrario debemos de crear todo el VSS desde cero y de ser necesario configurar todo el VSS 6500 por la cual nos va a tomar mucho tiempo. Paso 1 Teniendo la configuración de respaldo debemos de tener claro cual era el chasis activo para mantener de ser necesario un requerimiento de la compañía. Teniendo la configuración y el IOS se debe de desconectar (mejor práctica no necesario) el VSL link y reemplazar las supervisoras dañadas. Paso 2 9
Siguiendo un estándar del cliente se debe de transferir la imagen y configuración al que va a ser el chasis activo. Como se ha estado mencionando es muy importante tener muy claro el número de identificador de la supervisora del que fuera el chasis activo de lo contrario de debe de cambiar la misma no obstante como ejemplo vamos a decir que el que el chasis activo tenía el switch_id 1. Paso 3 Teniendo la imagen, configuración e identificador correcta del switch se procede a reiniciar la supervisora sin salvar los cambios. Cabe resaltar como se mencionó que la CONFIGURACIóN se debe de guardar en la startup-config y el IOS debe de estar en la misma localidad de memoria que la configuración de respaldo. Cuando esa supervisora inicie va a detectar la configuración de VSS y va a funcionar como chasis activo esto debido a la configuración preliminar. Ya teniendo el chasis activo debemos de levantar el standby por la cual seguiremos el paso 4. Paso 4 Se debe de tener la configuración (en NVRAM), el mismo IOS guardado en la misma locación de memoria que el chasis activo. Igual si no se tiene una tarjeta flash compacta se debe configurar un routed port o configurar la supervisora para tener conectividad con nuestro servidor de TFTP. Se procede a cambiar el identificador del switch (switch_id) esto debido a QUE TODA SUPERVISORA VIENE POR DEFECTO con identificador 1 y el chasis standby tiene identificador número 2 SupervisoraReemplazo #switch read switch_num local Read switch_num from Active rommon is 1 SupervisoraReemplazo # switch set switch_num 2 local (el local se puede omitir) Set rommon's switch_num to 2 Confirmar el cambio: SupervisoraReemplazo #switch read switch_num local Read switch_num from Active rommon is 2 10
Paso 5 Se reinicia la supervisora del chasis de standby e igual NO SE SALVA LA CONFIGURACIóN System configuration has been modified. Save? [yes/no]: no Después de darle un reload se debe de conectar el VSL link. A este punto esa supervisora va a detectar la configuración virtual y va a iniciarse como chasis standby porque el activo tiene identificador numero 1 y de nuevo el 6500 VSS va a estar de nuevo funcionando a total satisfacción. 11
Conclusión Este documento es una simple una guía para los algunos escenarios en los que nos podemos encontrar y tener una mejor respuesta cuando se encuentren con una red caída, con miles de usuarios afectados sin poder continuar con su trabajo. Se busca se sigan algunas prácticas efectivas para poder restablecer los servicios de una forma concreta, concisa y rápida. 12
Bibliografía http://www.cisco.com/c/en/us/support/docs/switches/catalyst-6500-virtual-switching-system- 1440/109334-replace-vss-sup-proc-v1.html 13