¿Qué es QUORUM Disk y Fencing Wars?


Hola amigos. Esta vez pensé en responder en detalle a una de nuestras lectoras (Danielle) pregunta formulada en los comentarios porque es posible que también hayas enfrentado este problema cuando hay un entorno agrupado bajo tu responsabilidad de mantener.

A continuación se muestra la pregunta de Daniel Bello.

“Tengo una pregunta: intenté configurar un dispositivo virtual de cerca en un entorno virtual, pero no me funciona, en alguna parte de mi configuración, el nodo no vuelve al clúster después de una falla. Entonces agregué un disco de quórum, y finalmente mi clúster funciona bien (el nodo se cae y después de la falla vuelve al clúster), entonces mi pregunta es: ¿cuál es la diferencia entre un dispositivo de cerca y un disco de quórum en un virtual ¿ambiente?"

Puede referirse a lo que es un dispositivo de cercado consultando nuestra serie de artículos anteriores de Clustering a continuación.

  1. Cercado y adición de una conmutación por error a la agrupación en clústeres - Parte 3

Primero veamos qué es un disco de quórum.

¿Qué es Quorum Disk?

Un disco de quórum es el tipo de almacenamiento de configuraciones de clúster. Actúa como una base de datos que contiene los datos relacionados con el entorno en clúster y el deber del disco de quórum es informar al clúster qué nodo/nodos deben mantener en estado VIVO. Permite el acceso concurrente desde todos los demás nodos para leer/escribir datos.

Cuando la conectividad cae entre los nodos (puede ser un nodo o más de uno), el quórum aísla los que no tienen conexión y mantiene los servicios en funcionamiento con los nodos activos que tiene. Deja fuera de servicio los nodos sin conectividad del clúster.

Pasemos ahora a la pregunta. Esto parece un entorno que tiene 2 nodos y uno ha caído. La situación que enfrentó Danielle parece una "Guerra de Esgrima" entre los dos nodos activos.

Considere que hay un entorno en clúster en el que no se agrega ningún disco de quórum a la configuración. Este clúster tiene 2 nodos y actualmente un nodo ha fallado. En este escenario particular, la conectividad entre el nodo 1 y el nodo 2 se pierde por completo.

Luego, el nodo 1 ve que el nodo 2 ha fallado porque no puede establecer una conexión con él y el nodo 1 decide cercar el nodo 2. Al mismo tiempo, el nodo 2 ve que el nodo 1 ha fallado porque no puede establecer una conexión con él y el nodo 2 decide para cercar el nodo 1 también.

Dado que el nodo 1 ha cercado al nodo 2, se hace cargo de los servicios y recursos que están agrupados. Dado que no hay un disco de quórum para verificar esta situación en el nodo 2, el nodo 2 puede reiniciar todos los servicios en el servidor sin ninguna conexión con el nodo 1.

Como mencioné anteriormente, el nodo 2 también cerca al nodo 1 porque no puede ver ninguna conexión al nodo 1 desde el nodo 2 y lo que sucede a continuación es que el nodo 1 reinicia todos los servicios en el servidor porque no hay quórum para verificar el estado del nodo 1 también.

Esto se identifica como una guerra de esgrima.

Ahora, este ciclo continuará eternamente hasta que un ingeniero detenga los servicios manualmente o los servidores se apaguen o la conexión de red se establezca con éxito entre los nodos. Aquí es donde un disco de quórum viene a ayudar. El proceso de votación en las configuraciones de quórum es el mecanismo que evita que se produzca el ciclo anterior.

  1. Los entornos en clúster se utilizan en todas partes para la seguridad de los datos y los servicios para brindar a los usuarios finales el máximo tiempo de actividad y la experiencia de datos en vivo.
  2. Un dispositivo de valla se utiliza en entornos agrupados para aislar un nodo cuyo estado es desconocido para otros nodos. El clúster utilizará un dispositivo de valla para vallar (eliminar) automáticamente el nodo fallido y mantener los servicios en funcionamiento e iniciar la conmutación por error en los procesos.
  3. No es esencial tener un disco de quórum en un entorno agrupado, pero es mejor tener uno en un clúster de 2 nodos para evitar guerras de esgrima.
  4. No es un problema tener un disco de quórum en un clúster donde hay más de 2 nodos, pero es menos probable que ocurra una guerra de esgrima en un entorno en particular. Por lo tanto, es menos importante tener un disco de quórum en un clúster de 3 o más nodos que en un clúster de 2 nodos.
  5. Por cierto, es bueno tener un disco de quórum en un entorno de clúster de varios nodos, de modo que pueda ejecutar verificaciones de estado personalizadas por el usuario entre los nodos.

Importante: tenga en cuenta que existe un límite en el que puede agregar nodos al quórum. Puede agregarle un máximo de 16 nodos.

Espero que hayas disfrutado del artículo. Manténgase en contacto con tecmint para obtener guías técnicas de Linux más prácticas.