RAID
4 y 5
Un RAID 4, también conocido como IDA (acceso independiente con discos dedicados a la paridad) usa división a nivel de bloques con un disco de paridad dedicado. Necesita un mínimo de 3 discos físicos. El RAID 4
es parecido al RAID 3 excepto porque divide a nivel de bloques en lugar de a
nivel de bytes. Esto permite que cada miembro del conjunto funcione
independientemente cuando se solicita un único bloque. Si la controladora de
disco lo permite, un conjunto RAID 4 puede servir varias peticiones de lectura
simultáneamente. En principio también sería posible servir varias peticiones de
escritura simultáneamente, pero al estar toda la información de paridad en un
solo disco, éste se convertiría en el cuello de botella del conjunto.
En definitiva el RAID 4 distribuye la información a nivel de bloques y dedica
un solo disco a almacenar la información de paridad, lo que permite que cada disco funcione independiente
cuando se realiza una petición al sistema, ya sea de lectura o de escritura. Si
su controladora lo permite, un sistema RAID 4 puede servir varias peticiones de
lectura o de escritura simultáneamente. El atasco se da en el disco dedicado a
la información de paridad.
Cada
número representa un dato (0,1,..., 4, 5) y cada letra (A, B, C y D) un
dispositivo. Cada par letra-número (A0, B0,..., B5, C5) representa un bloque de
datos. Así vemos como el dato 0 se divide en bloques (A0, B0, C0) que van
siendo almacenados a lo largo de los dispositivos. En el último disco, el D, no
se almacena ningún byte de datos, si no que se almacena la información de
Paridad.
Un RAID
5 (también llamado distribuido con paridad) es una división de datos a nivel de bloques distribuyendo la información de paridad entre todos los discos miembros del conjunto. El RAID 5 ha
logrado popularidad gracias a su bajo coste de redundancia. Generalmente, el
RAID 5 se implementa con soporte hardware para el cálculo de la paridad. RAID 5
necesitará un mínimo de 3 discos para ser implementado.
Cada vez que un bloque de datos se escribe en un
RAID 5, se genera un bloque de paridad dentro de la misma división. Un bloque
se compone a menudo de muchos sectores consecutivos de disco. Una serie de
bloques (un bloque de cada uno de los discos del conjunto) recibe el nombre
colectivo de división. Si otro bloque, o alguna porción de un bloque, es
escrita en esa misma división, el bloque de paridad (o una parte del mismo) es
recalculada y vuelta a escribir. El disco utilizado por el bloque de paridad
está escalonado de una división a la siguiente, de ahí el término «bloques de
paridad distribuidos». Las escrituras en un RAID 5 son costosas en términos de
operaciones de disco y tráfico entre los discos y la controladora.
Los bloques de paridad no se leen en las
operaciones de lectura de datos, ya que esto sería una sobrecarga innecesaria y
disminuiría el rendimiento. Sin embargo, los bloques de paridad se leen cuando
la lectura de un sector de datos provoca un error de CRC.
En este caso, el sector en la misma posición relativa dentro de cada uno de los
bloques de datos restantes en la división y dentro del bloque de paridad en la
división se utilizan para reconstruir el sector erróneo. El error CRC se oculta
así al resto del sistema. De la misma forma, si falla un disco del conjunto,
los bloques de paridad de los restantes discos son combinados matemáticamente
con los bloques de datos de los restantes discos para reconstruir los datos del
disco que ha fallado «al vuelo».
En definitiva el RAID 5 está diseñado para ofrecer el nivel de rendimiento de un RAID
0 con una redundancia más económica y es el nivel RAID más habitual en la
mayoría de empresas. Lo consigue distribuyendo bloques de datos entre distintas
unidades y repartiendo la paridad entre ellas. No se dedica ningún disco a la
paridad de forma exclusiva. Las ventajas de utilizar una RAID 5 consisten en
poder realizar operaciones de lectura y escritura de forma solapada (es decir,
en poder hacer un uso más eficiente de las unidades de disco), lo que acelera
los pequeños procesos de escritura en un sistema multiprocesador y facilita una
cantidad de almacenamiento usable superior al de la RAID 1 o 10. La protección
de los datos reside en la información de la paridad que se utiliza para
reconstruir los datos si una unidad del grupo RAID falla o sufre una avería.
Entre los inconvenientes, se encuentran: la necesidad de un mínimo de tres
discos por grupo RAID, un nivel de rendimiento del sistema de almacenamiento
significativamente inferior mientras se lleva a cabo la reconstrucción de una
unidad, y la posibilidad de perder totalmente los datos de un grupo RAID si
falla una segunda unidad mientras se está realizando la reconstrucción de la
primera. Además, el rendimiento de lectura suele ser inferior al de otras
modalidades de RAID porque los datos de la paridad se distribuyen entre cada
una de las unidades.
No hay comentarios:
Publicar un comentario