top of page

¿Qué son los RAID?

RAID es una tecnología que se utiliza para aumentar el rendimiento y la fiabilidad del almacenamiento de datos. La abreviatura significa de RAID (Redundant Array of Inexpenses or Inteligent- Disk) arreglo redundante de discos económicos o inteligentes. Un sistema RAID consta de dos o más unidades de disco que funcionan en paralelo. Estos discos pueden ser discos duros, pero existe una tendencia a usar también la tecnología para SSD (discos de estado sólido). Hay diferentes niveles de RAID, cada uno optimizado para una situación específica. Estos no están estandarizados por un grupo de industria o un comité de estandarización. Esto explica por qué las empresas a veces presentan sus propios números e implementaciones únicos.

 

Este artículo cubre los siguientes niveles de RAID:


RAID 0 - Bandas o franjas (Striping)  

RAID 1 – Espejo (Mirroring)

RAID 5 – Bandas con paridad (Striping with parity)

RAID 6 - Bandas con doble paridad (Striping with double parity)

RAID 10 - Combinación de espejo y bandas (Combining mirroring with striping)

El software para realizar la funcionalidad RAID y controlar las unidades puede ubicarse en una tarjeta controladora separada (un controlador RAID de hardware) o simplemente puede ser un controlador. Algunas versiones de Windows, como Windows Server 2012 y Mac OS X, incluyen la funcionalidad de software RAID. Linux viene con un software incluido en el sistema y para UNIX existen paquetes de software.  Los controladores RAID de hardware cuestan más que el software puro, pero también ofrecen un mejor rendimiento, especialmente con RAID 5 y 6.

 

Los sistemas RAID se pueden usar con varias interfaces, incluidas SCSI, IDE, SATA o FC (canal de fibra). Hay sistemas que usan discos SATA de forma interna, pero que tienen una interfaz FireWire o SCSI para el sistema host.

 

A veces, los discos en un sistema de almacenamiento se definen como JBOD, que significa Just a Bunch of Disks (Solo un grupo de discos). Esto significa que esos discos no usan un nivel de RAID específico y actúan como discos independientes. Esto se hace a menudo para unidades que contienen archivos de intercambio o datos de cola de impresión.

 

A continuación se muestra una descripción general de los niveles de RAID más populares:

 

Nivel RAID 0: Trazado de Bandas (Striping)

 

En un sistema RAID 0, los datos se dividen en bloques que se escriben en todas las unidades del arreglo. Al usar múltiples discos (al menos 2) al mismo tiempo, esto ofrece un rendimiento superior de I/O (Entrada/Salida). Este rendimiento se puede mejorar aún más mediante el uso de varios controladores, idealmente un controlador por disco.

Ventajas

  • El RAID 0 ofrece un gran rendimiento, tanto en operaciones de lectura como de escritura. No hay sobrecarga causada por los controles de paridad.

  • Se utiliza toda la capacidad de almacenamiento, no hay gastos generales.

  • La tecnología es fácil de implementar.

 

Desventajas

 

  • El RAID 0 no es tolerante a fallas. Si un disco falla, todos los datos en el arreglo RAID 0 se pierden. No debe usarse para sistemas de misión crítica.

 

Uso ideal

 

  • El RAID 0 es ideal para el almacenamiento no crítico de datos que deben leerse y/o escribirse a alta velocidad, como en una estación de retoque de imágenes o edición de vídeo.

 

Si deseas usar RAID 0 sólo para combinar la capacidad de almacenamiento de dos discos en un solo volumen, considera montar una unidad en la ruta de la carpeta y el otro disco en la otra unidad. Esto es compatible con Linux, OS X y Windows.

 

Nivel RAID 1: Espejo (Mirroring)

 

Los datos se almacenan dos veces escribiéndolos en los discos de datos (o en el conjunto de discos de datos) y en un disco espejo (o un conjunto de discos). Si falla un disco, el controlador utiliza el otro disco de datos o el disco espejo para la recuperación de datos y la operación continúa. Necesita al menos 2 discos para un arreglo RAID 1.

Ventajas

 

  • RAID 1 ofrece una excelente velocidad de lectura y una velocidad de escritura que es comparable a la de un solo disco.

  • En caso de que un disco falle, los datos no tienen que ser reconstruidos, solo tienen que ser copiados al disco de reemplazo.

  • RAID 1 es una tecnología muy simple.

 

Desventajas

 

  • La principal desventaja es que la capacidad de almacenamiento efectiva es solo la mitad de la capacidad total del disco porque todos los datos se escriben dos veces.

  • Las soluciones de software RAID 1 no siempre permiten un intercambio en caliente de un disco dañado. Eso significa que los discos dañados solo puede reemplazarse después de apagar la computadora a la que está conectada. Para servidores que muchas personas utilizan simultáneamente, puede que esto no sea aceptable. Tales sistemas generalmente usan controladores de hardware que admiten el intercambio en caliente.

 

Uso ideal

 

  • RAID 1 es ideal para el almacenamiento de misión crítica, por ejemplo, para sistemas ERP de la compañía. También es adecuado para servidores pequeños en los que solo se utilizarán dos discos de datos.

 

Nivel RAID 5: Bandas con paridad (Striping with parity)

 

RAID 5 es el nivel de RAID más común. Requiere al menos 3 discos, pero puede funcionar con hasta 16. Los bloques de datos se alinean en los discos y en una unidad se registra una suma de comprobación de paridad de todos los bloques de datos. Los datos de paridad no se escriben en un disco fijo, sino que se distribuyen en todas los discos, como se muestra en la imagen de esquema de RAID 5. Usando los datos de paridad, la computadora puede volver a calcular los datos de uno de los otros bloques de datos, si esos datos ya no están disponibles. Eso significa que un arreglo RAID 5 puede soportar la falla de un disco sin perder datos o el acceso a los datos. Aunque se puede lograr RAID 5 en el software, se recomienda un controlador de hardware. Con frecuencia se usa memoria caché adicional en estos controladores para mejorar el rendimiento de escritura.

 

Aplicando un poco más de matemáticas la paridad de datos para un RAID 5 se calcula usando la puerta lógica XOR. A efectos prácticos significa que dados unos valores de entrada (escrituras en disco) se devuelve un valor de salida (paridad) y lo que es más importante es reversible.

 

La puerta lógica XOR se puede definir como aquella que da como resultado 1 cuando los dos valores de entrada son distintos. En caso de haber más de dos valores de entrada el resultado siempre será 1 cuando la suma de unos en la entrada sea impar. Veamos un ejemplo:
0 XOR 0 = 0
0 XOR 1 = 1
1 XOR 0 = 1
1 XOR 1 = 0

 

Esto traducido al mundo RAID sería:
0 0 -> paridad 0
0 1 -> paridad 1
1 0 -> paridad 1
1 1 -> paridad 0

Ventajas

 

  • Las transacciones de datos que se leen son muy rápidas, mientras que las transacciones de datos de escritura son algo más lentas (debido a la paridad que debe calcularse).

  • Si falla un disco (solo puede fallar uno si falla otro adiós a la información), aún tiene acceso a todos los datos, incluso cuando se está reemplazando el disco defectuoso y el controlador de almacenamiento reconstruye los datos en el disco nuevo.

 

Desventajas

 

  • Las fallas de los discos tienen un efecto sobre el rendimiento, aunque esto aún es aceptable.

  • Esta es una tecnología compleja. Si uno de los discos de un arreglo que utiliza discos de 4TB falla y se reemplaza, la restauración de los datos (el tiempo de reconstrucción) puede tomar un día o más, dependiendo de la carga en el arreglo y la velocidad del controlador. Si otro disco se daña durante ese tiempo, los datos se pierden para siempre.

 

Uso ideal

 

  • RAID 5 es un buen sistema que combina almacenamiento eficiente con excelente seguridad y un rendimiento decente. Es ideal para servidores de archivos y aplicaciones que tienen un número limitado de discos de datos.

 

Nivel RAID 6: Trazado de bandas con doble paridad

 

RAID 6 es como RAID 5, pero los datos de paridad se escriben en dos discos. Eso significa que requiere al menos 4 discos y puede soportar 2 discos que fallen simultáneamente. Las posibilidades de que dos discos fallen exactamente en el mismo momento son, por supuesto, muy pequeñas. Sin embargo, si un disco en un sistema RAID 5 muere y es reemplazado por un disco nuevo, la reconstrucción del disco intercambiado demora horas o incluso más de un día. Si otra unidad muere durante ese tiempo, perderá todos sus datos. Con RAID 6,  el arreglo sobrevivirá inclusos habiendo una segunda falla.

Ventajas

 

  • Al igual que con RAID 5, las transacciones de lectura de datos son muy rápidas.

  • Si dos discos fallan, todavía se tiene acceso a todos los datos, incluso cuando los discos defectuosos estén siendo reemplazados. Por lo tanto, RAID 6 es más seguro que RAID 5.

 

Desventajas

 

  • Las transacciones de escritura de datos son más lentas que RAID 5 debido a los datos de paridad adicionales que deben calcularse. El rendimiento de escritura podría ser hasta un 20% menor.

  • Las fallas de disco tienen un efecto sobre el rendimiento, aunque esto aún es aceptable.

  • Esta es una tecnología compleja. Reconstruir un arreglo en el que falló una unidad puede llevar mucho tiempo.

 

Uso ideal

 

  • RAID 6 es un buen sistema versátil que combina almacenamiento eficiente con excelente seguridad y rendimiento decente. Es preferible en los servidores de archivos y aplicaciones que usan muchos discos para el almacenamiento de datos.

 

Nivel RAID 10: combinación de RAID 1 y RAID 0

 

Es posible combinar las ventajas (y desventajas) de RAID 0 y RAID 1 en un solo sistema. Esta es una configuración RAID anidada o híbrida. Proporciona seguridad mediante la duplicación de todos los datos en los discos secundarios al tiempo que utiliza el trazado de bandas en cada conjunto de discos para acelerar las transferencias de datos.

Ventajas

 

  • Si algo sale mal con uno de los discos en una configuración RAID 10, el tiempo de reconstrucción es muy rápido ya que todo lo que se necesita es copiar todos los datos del espejo superviviente a una nueva unidad. 

Desventajas

  • La mitad de la capacidad de almacenamiento va a la creación de reflejos, por lo que en comparación con las grandes matrices RAID 5 o RAID 6, esta es una forma costosa de tener redundancia.

 

¿Qué pasa con los niveles RAID 2, 3, 4, 5+0 y 7?

 

Estos niveles existen, pero no son tan comunes (RAID 3 es esencialmente como RAID 5 pero con los datos de paridad escritos siempre en la misma unidad). Esta es solo una introducción simple a los sistemas RAID. Si necesitas más información de estos niveles de RAID te recomiendo preguntar a tu proveedor de servicios o simplemente ‘googlearlo’.

 

¡RAID no es un sustituto de la copia de seguridad!

 

Todos los niveles de RAID excepto RAID 0 ofrecen protección contra fallas de un solo disco. Un sistema RAID 6 incluso sobrevive a 2 discos que mueren simultáneamente. Es más, existen arreglos de discos que incluyen un disco de Spare (o de reserva) para que entre en función en automático inmediatamente después de que se presente la falla en un disco.

 

Pero para una seguridad completa, necesitas hacer una copia de seguridad de los datos o respaldo de un sistema RAID. Esa copia de seguridad será útil si todas las unidades fallan simultáneamente debido a un pico de energía o un problema más complejo. Es una protección cuando el sistema de almacenamiento es robado. Las copias de seguridad pueden mantenerse fuera del sitio en una ubicación diferente. Esto puede ser útil si un desastre natural o un incendio destruyen su lugar de trabajo. La razón más importante para realizar copias de seguridad de datos es cuando se presenta un error del usuario. Si alguien borra accidentalmente algunos datos importantes y esto pasa desapercibido durante varias horas, días o semanas, un buen conjunto de copias de seguridad asegura que aún puedas recuperar la información.

Referencias bibliográficas

https://www.prepressure.com/library/technology/raid

http://www.ingens-networks.com/blog/2012/04/25/raid-5-ventajas-y-carencias-i/

bottom of page