¿Qué es RAID (Redundant Array of Independent Disks)?
El concepto RAID incrementa la fiabilidad de las memorias de datos. Se desarrolló para los clásicos discos duros HDD y hoy en día sigue utilizándose en el entorno de los servidores. ¿Cuál es exactamente la estructura de los sistemas RAID y qué diferencias hay entre ellos?
- Certificado SSL Wildcard
- Registro privado
- 1 cuenta de correo electrónico por contrato
RAID: definición e historia
El término “RAID” se utilizó por primera vez en 1988 en la publicación “A case for redundant arrays of inexpensive disks (RAID)” de un grupo de informáticos de la Universidad de California en Berkeley. En esa obra, los autores debaten la posibilidad de combinar discos duros para PC de bajo coste en una matriz y hacerlos funcionar como una gran unidad lógica para tener una alternativa a los entonces costosísimos discos duros SLED (Single Large Expensive Disks) de las unidades centrales. Como con esto, el riesgo de fallo aumenta automáticamente, el concepto prevé el almacenamiento redundante de datos.
En los años siguientes, RAID se estandarizó y desarrolló cada vez más, pasando a primer plano su uso en aplicaciones de servidor. Como resultado, el ahorro de costes dejó de desempeñar un papel importante; ahora el objetivo principal de la matriz era sustituir fácilmente los discos duros durante el funcionamiento sin dar problemas. El desglose del acrónimo RAID: Redundant Array of Independent Disks (matriz redundante de discos independientes en español) hace referencia a esta misma función. La tecnología RAID está basada en las propiedades de los discos duros HDD clásicos. Los SSD modernos también se dejan agrupar, pero pierden rendimiento y, debido a la falta de funcionalidad TRIMP en los RAID, también vida útil.
Un RAID (Redundant Array of Independent Disks) es una matriz de al menos dos unidades de almacenamiento distintas convertidas en una única unidad lógica grande. El principio base de un sistema RAID es almacenar datos de manera redundante, lo que garantiza que la integridad y funcionalidad de la matriz completa no queden comprometidas por un fallo en un disco duro.
El papel de los sistemas RAID en los entornos de servidores de la actualidad
Los sistemas RAID siguen siendo demandados como una parte importante de los entornos de servidores. Su aspecto más relevante es la redundancia de los datos almacenados que en este caso no se equiparan a una copia de seguridad al uso. En las estructuras de servidores, los RAID están pensados para que el fallo de un solo disco duro no tenga consecuencias, ya que los datos que contiene están también archivados en otros lugares de la matriz RAID. Otra de las ventajas que tiene utilizar un sistema RAID es el aumento de la capacidad de almacenamiento y una mayor velocidad de lectura y escritura al acceder a las memorias de disco duro.
Desde el punto de vista del usuario, una matriz RAID, que está compuesta siempre como mínimo de dos dispositivos de almacenamiento, no se diferencia de un único soporte de datos lógico.
La forma exacta en la que interactúan los dispositivos de almacenamiento individuales de un sistema RAID y la función que finalmente debería realizar una matriz en una red de servidores pueden variar enormemente. No obstante, existen distintas configuraciones estandarizadas que definen los niveles RAID. Además, se distingue entre los RAID de software y de hardware en función de si la interacción de la matriz se organiza en el software o en el hardware.
¿Qué diferencia hay entre los RAID de software y de hardware?
La categorización en RAID de software o de hardware puede dar una idea equivocada de en qué consisten estos dos tipos de matrices de discos duros. Para su funcionamiento, ambas variantes necesitan software; los términos hacen referencia únicamente al tipo de implementación.
En los RAID por hardware, la organización de los dispositivos de almacenamiento individuales recae en un hardware especial y potente, también llamado controladora RAID. Esta controladora se instalará, o bien en la torre del ordenador o en una matriz de discos (“disk array”), en la que también se alojan los discos duros. Esta última variante es la preferida por los centros de procesamiento de datos, donde los sistemas externos suelen utilizarse bajo las denominaciones DAS (Direct Attached Storage), SAN o NAS. La gran ventaja de una organización de RAID por hardware es el excelente rendimiento, que se traduce, entre otras cosas, en una elevada velocidad de transferencia de datos.
En un RAID por software, un software que se ejecuta directamente en la CPU del host asume la gestión de la cuota de almacenamiento. Por esta razón, también se conoce como sistema RAID basado en host. Los sistemas operativos comunes como Windows (a partir de NT) o las distribuciones de Linux proporcionan los componentes necesarios para este RAID, que, en comparación con la alternativa de hardware, es mucho más barato y rápido de configurar. Los inconvenientes de este sistema son la alta carga de CPU para el host y la falta de independencia de la plataforma. Además, el rendimiento también es peor, ya que los accesos al disco no pueden regularse de manera tan elegante como con una controladora RAID:
RAID por software | RAID por Hardware | |
---|---|---|
Costes | Bajo | Alto |
Carga en la CPU (Host) | Alto | Bajo |
Rendimiento | Bajo | Alto |
Independencia de la plataforma | No | Sí |
Dependencia del sistema operativo | Sí | No |
Visión general de los niveles RAID más comunes
Como hemos mencionado, un “nivel” es la forma en la que los discos duros se combinan entre sí en un RAID. No obstante, esta designación tiende a provocar malentendidos, ya que las distintas configuraciones posibles de los discos duros no se acumulan por niveles. Los números de los distintos niveles no tienen ninguna relación; solo indican los diferentes enfoques para la estructura y la posterior función del RAID. Los niveles más utilizados son RAID 0, RAID 1, RAID 5 y RAID 6. También se pueden combinar dos niveles RAID. RAID 10, por ejemplo, se refiere a un sistema RAID 0 ensamblado a partir de varios sistemas RAID 1.
Los niveles RAID presentados a continuación indican los sistemas RAID estandarizados por la Raid Advisory Board (RAB). Paralelamente, existen numerosas configuraciones RAID específicas a algunos fabricantes con nombres o designaciones individuales que sin embargo no incluimos en este artículo.
RAID 0: striping
En sentido puramente estricto, las matrices de discos duros que llevan la etiqueta RAID 0 no cuentan como sistemas RAID, ya que no se basan en la redundancia para el almacenamiento. Este modelo solo sirve para acelerar el acceso a los datos combinando dos o más discos duros en una unidad lógica. Para ello, los datos se distribuyen uniformemente entre los distintos soportes de datos en bloques sucesivos. Estos bloques se denominan stripes en inglés, por lo que el RAID 0 también se conoce como “striping”. Mientras que la matriz proporciona más capacidad de almacenamiento y una mayor tasa de rendimiento, también reduce automáticamente la seguridad. Si un disco duro falla, se pierden todos los datos. Para más información sobre el enfoque del striping, consulta nuestra detallada guía sobre RAID 0.
RAID 1: espejo
El RAID de nivel 1 se conoce como “espejo”. En esta matriz, todos los discos duros integrados presentan el mismo estado de datos en todo momento, por lo que ofrece una redundancia completa y puede suplir fácilmente el fallo de las unidades de almacenamiento individuales. Como consecuencia, la capacidad del RAID siempre es, como mucho, tan alta como la capacidad del disco duro más pequeño involucrado. La velocidad de escritura de un RAID 1 es tan rápida como la de una unidad individual, pero si se conectan los discos implicados a sus propios canales, como por ejemplo en SATA, la velocidad de lectura se duplica. Para más información sobre el método de almacenamiento del “espejo”, consulta nuestro completo artículo temático “RAID 1”.
RAID 5: striping con información de paridad distribuida
El RAID 5 describe una matriz de tres o más discos cuya cantidad suele ser impar: tres, cinco, siete, etc. El concepto de almacenamiento utiliza el striping conocido por el RAID 0 y distribuye los datos en bloques en los distintos soportes de datos. Junto con los bloques de datos, la información paritaria se distribuye uniformemente por los discos montados; esto puede utilizarse para recuperar los datos perdidos si falla un dispositivo de almacenamiento. Por eso, RAID 5 proporciona una mayor velocidad de lectura, así como más seguridad que una unidad individual. Al recalcular constantemente los bloques de paridad, la velocidad de escritura se reduce, pero en comparación solo ligeramente. Obtén más información sobre este concepto en nuestro especial artículo sobre RAID 5.
RAID 6: striping con doble información de paridad distribuida
El nivel RAID 6 tiene un enfoque similar al del RAID 5. Con él también se distribuyen los datos en bloques uniformemente por los componentes de almacenamiento integrados. Mediante la información de paridad, aumenta la seguridad. Sin embargo, estos últimos datos que se recuperan se generan por duplicado, por lo que este tipo de RAID puede lidiar con el fallo simultáneo de hasta dos discos (con una cantidad mínima de cuatro). De esta manera, la matriz ofrece una alta seguridad de datos y un buen acceso a la lectura. Dado que el cálculo de los bloques de paridad requiere aún más tiempo que con el RAID 5, la velocidad de escritura es incluso menor. En nuestra guía específica sobre RAID 6 examinamos los puntos fuertes y débiles del striping con doble información de paridad distribuida más de cerca.
RAID 10: RAID 0 con múltiples RAID 1
El RAID 10, o RAID 1+0, combina las propiedades de RAID nivel 0 y RAID nivel 1: una mayor velocidad de transmisión de datos y una elevada seguridad de datos. Con este fin, se juntan varios sistemas RAID 1 en una matriz RAID 0, donde se necesitan al menos cuatro discos. Te explicamos en detalle cuándo merece la pena esta combinación y qué desventajas tiene en nuestro artículo sobre RAID 10.
En nuestra guía “Comparativa de los niveles RAID” comparamos las configuraciones estándar más importantes y exponemos las diferencias, ventajas y desventajas así como los posibles usos.
¿Qué hay que tener en cuenta al instalar y configurar un RAID?
Al montar y poner en funcionamiento un sistema RAID, hay que tener varias cosas en cuenta. La primera pregunta es inevitablemente qué tipo de matriz instalar. Si por ejemplo únicamente queremos aumentar el rendimiento de los datos, tenemos disponible, además de un sistema de nivel 0, una unidad SSD como alternativa. Si en cambio lo que queremos es aumentar la seguridad de los datos, con el espejo (por ejemplo, el nivel 1) y el almacenamiento con información de paridad (por ejemplo, el nivel 5) contamos con dos enfoques distintos.
A la hora de seleccionar discos duros, lo ideal es dar preferencia a modelos idénticos. En muchas configuraciones RAID, el volumen máximo de almacenamiento se basa en el disco más pequeño, por lo que con distintos tamaños se perdería potencial de almacenamiento. Es aún más importante confiar en un hardware, como los discos duros NAS, que están diseñados para ser muy longevos. El tamaño de los soportes de datos también desempeña un papel al sustituir posteriormente hardware defectuoso o al ampliar el RAID. Los componentes nuevos han de tener como mínimo el tamaño del soporte de datos más pequeño que se ha utilizado hasta el momento o del soporte de datos defectuoso.
Otra cuestión que nunca deberíamos olvidar al utilizar una matriz RAID: la interacción de los diferentes discos duros aumenta la seguridad de los datos almacenados mediante la redundancia, pero una copia de seguridad bien organizada no puede ni debe sustituir a un RAID.
¿Buscas una solución para crear copias de seguridad seguras y sencillas de tu smartphone, tu PC o tu nube? Con Backup Cloud de IONOS obtendrás una protección fantástica para todos tus datos y dispositivos.