Búsqueda de sitios web

Introducción a RAID, conceptos de RAID y niveles de RAID - Parte 1


RAID es una matriz redundante de discos económicos, pero hoy en día se llama matriz redundante de unidades independientes. Antes solía ser muy costoso comprar incluso un tamaño de disco más pequeño, pero hoy en día podemos comprar un disco de gran tamaño con la misma cantidad que antes. Raid es solo una colección de discos en un grupo para convertirse en un volumen lógico.

Raid contiene grupos o conjuntos o matrices. Una combinación de controladores forma un grupo de discos para formar una matriz RAID o un conjunto RAID. Puede haber un mínimo de 2 discos conectados a un controlador raid y formar un volumen lógico o pueden haber más unidades en un grupo. Solo se puede aplicar un nivel de Raid en un grupo de discos. Los raid se utilizan cuando necesitamos un rendimiento excelente. Según nuestro nivel de incursión seleccionado, el rendimiento será diferente. Guardar nuestros datos mediante tolerancia a fallos y alta disponibilidad.

Esta serie se titulará Preparación para la configuración de RAID hasta las Partes 1 a 9 y cubre los siguientes temas.

Esta es la Parte 1 de una serie de 9 tutoriales, aquí cubriremos la introducción de RAID, los conceptos de RAID y los niveles de RAID que se requieren para configurar RAID en Linux.

RAID de software y RAID de hardware

El Software RAID tiene un rendimiento bajo debido al consumo de recursos de los hosts. El software raid debe cargarse para leer datos de los volúmenes raid de software. Antes de cargar el software raid, el sistema operativo debe iniciarse para cargar el software raid. No hay necesidad de hardware físico en ataques de software. Inversión a coste cero.

Hardware RAID tiene un alto rendimiento. Son controladores RAID dedicados que se construyen físicamente con tarjetas PCI express. No utilizará el recurso del host. Tienen NVRAM para caché para lectura y escritura. Almacena el caché durante la reconstrucción, incluso si hay un corte de energía, almacenará el caché utilizando respaldos de energía de la batería. Se necesitan inversiones muy costosas a gran escala.

La tarjeta RAID de hardware se verá como a continuación:

Conceptos destacados de RAID

  1. El método Paridad en raid regenera el contenido perdido a partir de la información guardada por paridad. RAID 5, RAID 6 basado en paridad.
  2. Stripe comparte datos aleatoriamente en varios discos. Esto no tendrá datos completos en un solo disco. Si usamos 3 discos, la mitad de nuestros datos estarán en cada disco.
  3. La duplicación se utiliza en RAID 1 y RAID 10. La duplicación consiste en hacer una copia de los mismos datos. En RAID 1 también guardará el mismo contenido en el otro disco.
  4. El Repuesto dinámico es solo una unidad de repuesto en nuestro servidor que puede reemplazar automáticamente las unidades fallidas. Si alguna de las unidades falla en nuestra matriz, esta unidad de repuesto se utilizará y se reconstruirá automáticamente.
  5. Los fragmentos son solo un tamaño de datos que puede tener un mínimo de 4 KB y más. Al definir el tamaño del fragmento podemos aumentar el rendimiento de E/S.

Los RAID están en varios niveles. Aquí veremos sólo los niveles RAID que se utilizan principalmente en entornos reales.

  1. RAID0=Franjas
  2. RAID1=Duplicación
  3. RAID5=Paridad distribuida de disco único
  4. RAID6=Paridad distribuida de doble disco
  5. RAID10=Combinación de Mirror y Stripe. (RAID anidado)

Los RAID se gestionan mediante el paquete mdadm en la mayoría de las distribuciones de Linux. Echemos un vistazo breve a cada nivel de RAID.

RAID 0 (o) creación de bandas

El striping tiene un excelente rendimiento. En Raid 0 (Striping), los datos se escribirán en el disco mediante el método compartido. La mitad del contenido estará en un disco y la otra mitad se escribirá en otro disco.

Supongamos que tenemos 2 unidades de disco, por ejemplo, si escribimos datos "TECMINT" en el volumen lógico, se guardarán como 'T' en el primer disco. y 'E' se guardará en el segundo disco y 'C' se guardará en el primer disco y nuevamente 'M' se guardará en Segundo disco y continúa en el proceso de operación por turnos.

En esta situación, si alguna de las unidades falla, perderemos nuestros datos, porque la mitad de los datos de uno de los discos no se pueden usar para reconstruir la incursión. Pero en comparación con la velocidad de escritura y el rendimiento, RAID 0 es excelente. Necesitamos al menos 2 discos para crear un RAID 0 (Striping). Si necesita sus datos valiosos, no utilice este NIVEL RAID.

  1. Alto rendimiento.
  2. No hay pérdida de capacidad cero en RAID 0
  3. Tolerancia cero a fallos.
  4. Escribir y leer serán un buen rendimiento.

RAID 1 (o) Duplicación

La duplicación tiene un buen rendimiento. La duplicación puede hacer una copia de los mismos datos que tenemos. Suponiendo que tenemos dos números de discos duros de 2 TB, en total tenemos 4 TB, pero en la duplicación mientras las unidades están detrás del controlador RAID para formar una unidad lógica, solo podemos ver los 2 TB de unidad lógica.

Mientras guardamos los datos, se escribirán en ambas unidades de 2 TB. Se necesitan un mínimo de dos unidades para crear un RAID 1 o Mirror. Si se produce una falla en el disco, podemos reproducir el conjunto de incursiones reemplazando un disco nuevo. Si alguno de los discos falla en RAID 1, podemos obtener los datos del otro, ya que había una copia del mismo contenido en el otro disco. Por lo tanto, no hay pérdida de datos.

  1. Buen rendimiento.
  2. Aquí se perderá la mitad del espacio en capacidad total.
  3. Tolerancia total a fallos.
  4. La reconstrucción será más rápida.
  5. El rendimiento de escritura será lento.
  6. La lectura será buena.
  7. Se puede utilizar para sistemas operativos y bases de datos a pequeña escala.

RAID 5 (o) paridad distribuida

RAID 5 se utiliza principalmente en niveles empresariales. RAID 5 funciona mediante el método de paridad distribuida. La información de paridad se utilizará para reconstruir los datos. Se reconstruye a partir de la información que queda en las unidades en buen estado restantes. Esto protegerá nuestros datos de fallos en la unidad.

Supongamos que tenemos 4 unidades, si una unidad falla y mientras reemplazamos la unidad fallida podemos reconstruir la unidad reemplazada a partir de la información de paridad. La información de paridad se almacena en los 4 discos, si tenemos 4 números de disco duro de 1TB. La información de paridad se almacenará en 256 GB en cada controlador y se definirán otros 768 GB en cada unidad para los Usuarios. RAID 5 puede sobrevivir a una falla de una sola unidad. Si fallan más de una unidad, se perderán datos.

  1. Excelente actuación
  2. La lectura será extremadamente buena en velocidad.
  3. La escritura será Media, lenta si no utilizamos un Controlador RAID de Hardware.
  4. Reconstruya a partir de información de paridad de todas las unidades.
  5. Tolerancia total a fallos.
  6. 1 espacio en disco estará bajo paridad.
  7. Se puede utilizar en servidores de archivos, servidores web, copias de seguridad muy importantes.

Disco distribuido de dos paridades RAID 6

RAID 6 es igual que RAID 5 con un sistema distribuido de dos paridades. Se utiliza principalmente en una gran cantidad de matrices. Necesitamos un mínimo de 4 unidades, incluso si fallan 2 unidades, podemos reconstruir los datos mientras reemplazamos unidades nuevas.

Muy más lento que RAID 5 porque escribe datos en los 4 controladores al mismo tiempo. La velocidad será promedio mientras usemos un controlador RAID de hardware. Si tenemos 6 unidades de discos duros de 1 TB, se usarán 4 unidades para datos y 2 unidades para paridad.

  1. Bajo rendimiento.
  2. El rendimiento de lectura será bueno.
  3. El rendimiento de escritura será deficiente si no utilizamos un controlador RAID de hardware.
  4. Reconstrucción a partir de 2 unidades de paridad.
  5. Tolerancia total a fallos.
  6. El espacio de 2 discos estará bajo paridad.
  7. Se puede utilizar en matrices grandes.
  8. Se puede utilizar con fines de copia de seguridad, transmisión de vídeo y a gran escala.

RAID 10 (o) Espejo y raya

RAID 10 se puede llamar como 1+0 o 0+1. Esto hará ambos trabajos de Mirror & Striping. Mirror será el primero y stripe será el segundo en RAID 10. Stripe será el primero y mirror será el segundo en RAID 01. RAID 10 es mejor en comparación con 01.

Supongamos que tenemos 4 unidades. Mientras escribo algunos datos en mi volumen lógico, se guardarán en las 4 unidades utilizando métodos de duplicación y banda.

Si escribo datos “TECMINT” en RAID 10, los guardará de la siguiente manera. El primero "T" escribirá en ambos discos y el segundo "E" escribirá en ambos discos; este paso se utilizará para toda la escritura de datos. También hará una copia de todos los datos en otro disco.

Al mismo tiempo, utilizará el método RAID 0 y escribirá los datos de la siguiente manera: "T" escribirá en el primer disco y "E" escribirá en el segundo disco. Nuevamente “C” escribirá en el primer disco y “M” en el segundo disco.

  1. Buen rendimiento de lectura y escritura.
  2. Aquí se perderá la mitad del espacio en capacidad total.
  3. Tolerancia a fallos.
  4. Reconstrucción rápida a partir de la copia de datos.
  5. Se puede utilizar en el almacenamiento de bases de datos para lograr un alto rendimiento y disponibilidad.

Conclusión

En este artículo hemos visto qué es RAID y qué niveles se utilizan principalmente en RAID en un entorno real. Espero que hayas aprendido el artículo sobre RAID. Para la configuración de RAID es necesario tener conocimientos básicos sobre RAID. El contenido anterior cumplirá con los conocimientos básicos sobre RAID.

En los próximos artículos, cubriré cómo configurar y crear un RAID usando varios niveles, hacer crecer un grupo RAID (matriz) y solucionar problemas con unidades fallidas y mucho más.