Introducción a RAID, conceptos de RAID y niveles de RAID - Parte 1


RAID es una matriz redundante de discos económicos, pero hoy en día se denomina matriz redundante de unidades independientes. Antes solía ser muy costoso comprar incluso un tamaño de disco más pequeño, pero hoy en día podemos comprar un disco de gran tamaño con la misma cantidad que antes. Raid es solo una colección de discos en un grupo para convertirse en un volumen lógico.

Raid contiene grupos o conjuntos o matrices. Una combinación de controladores crea un grupo de discos para formar una matriz RAID o un conjunto RAID. Puede ser un mínimo de 2 unidades de disco conectadas a un controlador RAID y hacer un volumen lógico o más unidades pueden estar en un grupo. Solo se puede aplicar un nivel de incursión en un grupo de discos. Las incursiones se utilizan cuando necesitamos un rendimiento excelente. Según nuestro nivel de incursión seleccionado, el rendimiento será diferente. Guardar nuestros datos mediante tolerancia a fallos y alta disponibilidad.

Esta serie se llamará Preparación para la configuración de RAID a través de las Partes 1-9 y cubre los siguientes temas.

Esta es la parte 1 de una serie de 9 tutoriales, aquí cubriremos la introducción de RAID, conceptos de RAID y niveles de RAID que se requieren para la configuración de RAID en Linux.

RAID de software y RAID de hardware

El software RAID tiene un rendimiento bajo debido al consumo de recursos de los hosts. El software de incursión debe cargarse para leer datos de los volúmenes de incursión de software. Antes de cargar el software de raid, el sistema operativo debe arrancar para cargar el software de raid. No se necesita hardware físico en redadas de software. Inversión de coste cero.

RAID de hardware tiene un alto rendimiento. Son controladores RAID dedicados que se construyen físicamente utilizando tarjetas PCI Express. No utilizará el recurso de host. Tienen NVRAM para caché para leer y escribir. Almacena la caché mientras se reconstruye, incluso si hay un corte de energía, almacenará la caché usando baterías de respaldo. Se necesitan inversiones muy costosas a gran escala.

La tarjeta RAID de hardware se verá a continuación:

  1. El método de paridad en raid regenera el contenido perdido a partir de la información guardada por paridad. RAID 5, RAID 6 basado en paridad.
  2. Stripe está compartiendo datos de forma aleatoria en varios discos. Esto no tendrá datos completos en un solo disco. Si usamos 3 discos, la mitad de nuestros datos estarán en cada disco.
  3. La duplicación se usa en RAID 1 y RAID 10. La duplicación es hacer una copia de los mismos datos. En RAID 1, también guardará el mismo contenido en el otro disco.
  4. Hot spare es solo una unidad de repuesto en nuestro servidor que puede reemplazar automáticamente las unidades fallidas. Si alguna de las unidades falla en nuestra matriz, esta unidad de repuesto en caliente se utilizará y se reconstruirá automáticamente.
  5. Los fragmentos son solo un tamaño de datos que puede tener un mínimo de 4 KB y más. Al definir el tamaño del fragmento, podemos aumentar el rendimiento de E/S.

Los RAID están en varios niveles. Aquí veremos solo los niveles de RAID que se utilizan principalmente en el entorno real.

  1. RAID0 u003d Creación de bandas
  2. RAID1 u003d Duplicación
  3. RAID5 u003d Paridad distribuida de un solo disco
  4. RAID6 u003d Paridad distribuida de disco doble
  5. RAID10 u003d Combinación de Mirror & Stripe. (RAID anidado)

Los RAID se administran mediante el paquete mdadm en la mayoría de las distribuciones de Linux. Echemos un vistazo breve a cada uno de los niveles de RAID.

Las rayas tienen un excelente rendimiento. En Raid 0 (Striping), los datos se escribirán en el disco mediante el método compartido. La mitad del contenido estará en un disco y la otra mitad se escribirá en otro disco.

Supongamos que tenemos 2 unidades de disco, por ejemplo, si escribimos datos “ TECMINT ” en el volumen lógico, se guardarán como ' T ' se guardarán en el primer disco y ' E ' se guardará en el segundo disco y ' C ' se guardará en el primer disco y nuevamente ' M ' se guardará en Segundo disco y continúa en proceso de operación por turnos.

En esta situación, si falla alguna de las unidades, perderemos nuestros datos, porque con la mitad de los datos de uno de los discos no se puede usar para reconstruir la incursión. Pero si se compara con la velocidad de escritura y el rendimiento, RAID 0 es excelente. Necesitamos al menos 2 discos para crear un RAID 0 (Striping). Si necesita sus datos valiosos, no utilice este NIVEL RAID.

  1. Alto rendimiento.
  2. No hay pérdida de capacidad en RAID 0
  3. Tolerancia cero a fallas.
  4. Escribir y leer será un buen rendimiento.

La duplicación tiene un buen rendimiento. La duplicación puede hacer una copia de los mismos datos que tenemos. Suponiendo que tenemos dos números de discos duros de 2TB, en total tenemos 4TB, pero en la duplicación mientras las unidades están detrás del controlador RAID para formar una unidad lógica. Solo podemos ver los 2TB de unidad lógica.

Mientras guardamos los datos, se escribirán en ambas unidades de 2TB. Se necesitan dos unidades como mínimo para crear un RAID 1 o Mirror. Si se produjo una falla en el disco, podemos reproducir el conjunto de incursiones reemplazando un disco nuevo. Si alguno de los discos falla en RAID 1, podemos obtener los datos de otro ya que había una copia del mismo contenido en el otro disco. Entonces no hay pérdida de datos.

  1. Buen rendimiento.
  2. Aquí la mitad del espacio se perderá en capacidad total.
  3. Tolerancia total a fallas.
  4. La reconstrucción será más rápida.
  5. El rendimiento de la escritura será lento.
  6. La lectura será buena.
  7. Se puede utilizar para sistemas operativos y bases de datos a pequeña escala.

RAID 5 se usa principalmente en niveles empresariales. RAID 5 funciona mediante el método de paridad distribuida. La información de paridad se utilizará para reconstruir los datos. Se reconstruye a partir de la información que queda en las unidades en buen estado restantes. Esto protegerá nuestros datos de fallas en la unidad.

Supongamos que tenemos 4 unidades, si una falla y mientras reemplazamos la unidad defectuosa, podemos reconstruir la unidad reemplazada a partir de la información de paridad. La información de paridad se almacena en las 4 unidades, si tenemos 4 números de unidad de disco duro de 1 TB. La información de paridad se almacenará en 256 GB en cada controlador y se definirán otros 768 GB en cada unidad para los Usuarios. RAID 5 puede sobrevivir a una sola falla de la unidad. Si las unidades fallan, más de una provocará la pérdida de datos.

  1. Excelente rendimiento
  2. La lectura será extremadamente rápida.
  3. La escritura será promedio, lenta si no usamos un controlador RAID de hardware.
  4. Reconstruir a partir de la información de paridad de todas las unidades.
  5. Tolerancia total a fallas.
  6. 1 espacio en disco estará bajo paridad.
  7. Se puede utilizar en servidores de archivos, servidores web, copias de seguridad muy importantes.

RAID 6 es igual que RAID 5 con sistema distribuido de dos paridades. Se utiliza principalmente en una gran cantidad de matrices. Necesitamos un mínimo de 4 unidades, incluso si fallan 2 unidades, podemos reconstruir los datos mientras reemplazamos nuevas unidades.

Muy más lento que RAID 5, porque escribe datos en los 4 controladores al mismo tiempo. Tendrá una velocidad promedio mientras usemos un controlador RAID de hardware. Si tenemos 6 unidades de disco duro de 1TB, se usarán 4 unidades para datos y 2 unidades para Parity.

  1. Rendimiento deficiente.
  2. El rendimiento de lectura será bueno.
  3. El rendimiento de escritura será deficiente si no utilizamos un controlador RAID de hardware.
  4. Reconstruir a partir de 2 unidades de paridad.
  5. Tolerancia total a fallas.
  6. El espacio de 2 discos estará por debajo de la paridad.
  7. Se puede utilizar en matrices grandes.
  8. Se puede usar con fines de respaldo, transmisión de video, usado a gran escala.

RAID 10 se puede llamar como 1 + 0 o 0 + 1. Esto hará los dos trabajos de Mirror & Striping. Mirror será el primero y stripe será el segundo en RAID 10. Stripe será el primero y el espejo será el segundo en RAID 01. RAID 10 es mejor en comparación con 01.

Supongamos que tenemos 4 unidades. Mientras escribo algunos datos en mi volumen lógico, se guardarán en las 4 unidades utilizando métodos de espejo y banda.

Si estoy escribiendo un dato " TECMINT " en RAID 10, guardará los datos de la siguiente manera. Primero " T " escribirá en ambos discos y el segundo " E " escribirá en ambos discos, este paso se utilizará para toda la escritura de datos. También hará una copia de todos los datos en otro disco.

Al mismo tiempo, utilizará el método RAID 0 y escribirá los datos de la siguiente manera, " T " escribirá en el primer disco y " E " escribirá en el segundo disco. De nuevo, " C " escribirá en el primer disco y " M " en el segundo.

  1. Buen rendimiento de lectura y escritura.
  2. Aquí la mitad del espacio se perderá en capacidad total.
  3. Tolerancia a fallas.
  4. Reconstrucción rápida a partir de la copia de datos.
  5. Se puede utilizar en el almacenamiento de bases de datos para obtener un alto rendimiento y disponibilidad.

Conclusión

En este artículo hemos visto qué es RAID y qué niveles se utilizan principalmente en RAID en un entorno real. Espero que haya aprendido el artículo sobre RAID. Para la configuración de RAID, es necesario conocer los conocimientos básicos sobre RAID. El contenido anterior cumplirá con los conocimientos básicos sobre RAID.

En los próximos artículos, cubriré cómo configurar y crear un RAID usando varios niveles, hacer crecer un grupo RAID (matriz) y solucionar problemas con unidades fallidas y mucho más.