Solución:
Solución 1:
RAID: por qué y cuándo
RAID son las siglas de Redundant Array of Independent Disks (a algunos se les enseña “Barato” para indicar que son discos “normales”; históricamente, había discos internamente redundantes que eran muy costosos; dado que ya no están disponibles, el acrónimo se ha adaptado).
En el nivel más general, un RAID es un grupo de discos que actúan sobre las mismas lecturas y escrituras. La E / S de SCSI se realiza en un volumen (“LUN”), y estos se distribuyen a los discos subyacentes de una manera que introduce un aumento del rendimiento y / o un aumento de la redundancia. El aumento del rendimiento es una función de la creación de bandas: los datos se distribuyen en varios discos para permitir que las lecturas y escrituras usen todas las colas de E / S de los discos simultáneamente. La redundancia es una función de la duplicación. Se pueden guardar discos enteros como copias o se pueden escribir bandas individuales varias veces. Alternativamente, en algunos tipos de incursiones, en lugar de copiar datos bit por bit, la redundancia se obtiene creando franjas especiales que contienen información de paridad, que se puede usar para recrear cualquier dato perdido en caso de una falla de hardware.
Hay varias configuraciones que brindan diferentes niveles de estos beneficios, que se tratan aquí, y cada una tiene un sesgo hacia el rendimiento o la redundancia.
Un aspecto importante a la hora de evaluar qué nivel de RAID funcionará para usted depende de sus ventajas y requisitos de hardware (por ejemplo: número de unidades).
Otro aspecto importante de la mayoría de estos tipos de RAID (0,1,5) es que no no Garantice la integridad de sus datos, ya que se extraen de los datos reales que se almacenan. Por tanto, RAID no protege contra archivos corruptos. Si un archivo está dañado por alguna significa, la corrupción se reflejará o se paritará y se confirmará en el disco independientemente. Sin embargo, RAID-Z afirma proporcionar integridad a nivel de archivo de sus datos.
RAID de conexión directa: software y hardware
Hay dos capas en las que se puede implementar RAID en el almacenamiento de conexión directa: hardware y software. En las verdaderas soluciones RAID de hardware, hay un controlador de hardware dedicado con un procesador dedicado a los cálculos y el procesamiento de RAID. También suele tener un módulo de caché respaldado por batería para que los datos se puedan escribir en el disco, incluso después de un corte de energía. Esto ayuda a eliminar inconsistencias cuando los sistemas no se apagan limpiamente. En términos generales, los buenos controladores de hardware tienen un mejor rendimiento que sus contrapartes de software, pero también tienen un costo sustancial y aumentan la complejidad.
Por lo general, el software RAID no requiere un controlador, ya que no utiliza un procesador RAID dedicado ni una caché separada. Normalmente, estas operaciones son manejadas directamente por la CPU. En los sistemas modernos, estos cálculos consumen recursos mínimos, aunque se incurre en cierta latencia marginal. RAID es manejado por el sistema operativo directamente o por un controlador falso en el caso de FakeRAID.
En términos generales, si alguien va a elegir el software RAID, debe evitar FakeRAID y usar el paquete nativo del sistema operativo para su sistema, como Dynamic Disks en Windows, mdadm / LVM en Linux o ZFS en Solaris, FreeBSD y otras distribuciones relacionadas. . FakeRAID utiliza una combinación de hardware y software que da como resultado la apariencia inicial de RAID de hardware, pero el rendimiento real del RAID de software. Además, comúnmente es extremadamente difícil mover la matriz a otro adaptador (si el original falla).
Almacenamiento centralizado
El otro lugar donde RAID es común es en dispositivos de almacenamiento centralizados, generalmente llamados SAN (red de área de almacenamiento) o NAS (almacenamiento conectado a la red). Estos dispositivos administran su propio almacenamiento y permiten que los servidores adjuntos accedan al almacenamiento de varias formas. Dado que varias cargas de trabajo están contenidas en los mismos pocos discos, generalmente es deseable tener un alto nivel de redundancia.
La principal diferencia entre un NAS y una SAN es la exportación a nivel de sistema de archivos frente a bloque. Una SAN exporta un “dispositivo de bloque” completo, como una partición o un volumen lógico (incluidos los construidos sobre una matriz RAID). Los ejemplos de SAN incluyen Fibre Channel e iSCSI. Un NAS exporta un “sistema de archivos”, como un archivo o una carpeta. Los ejemplos de NAS incluyen CIFS / SMB (uso compartido de archivos de Windows) y NFS.
RAID 0
Bueno cuando: ¡Velocidad a toda costa!
Malo cuando: te preocupas por tus datos
RAID0 (también conocido como Striping) a veces se denomina “la cantidad de datos que le quedan cuando falla una unidad”. Realmente va contra la corriente de “RAID”, donde la “R” significa “redundante”.
RAID0 toma su bloque de datos, lo divide en tantas piezas como discos tenga (2 discos → 2 piezas, 3 discos → 3 piezas) y luego escribe cada pieza de datos en un disco separado.
Esto significa que una sola falla de disco destruye toda la matriz (porque tiene la Parte 1 y la Parte 2, pero no la Parte 3), pero proporciona un acceso al disco muy rápido.
No se usa a menudo en entornos de producción, pero podría usarse en una situación en la que tiene datos estrictamente temporales que se pueden perder sin repercusiones. Se usa con cierta frecuencia para almacenar en caché dispositivos (como un dispositivo L2Arc).
El espacio de disco utilizable total es la suma de todos los discos de la matriz sumados (por ejemplo, 3 discos de 1 TB = 3 TB de espacio).
RAID 1
Bueno cuando: tiene un número limitado de discos pero necesita redundancia
Malo cuando: necesita mucho espacio de almacenamiento
RAID 1 (también conocido como Mirroring) toma sus datos y los duplica de forma idéntica en dos o más discos (aunque normalmente solo en 2 discos). Si se utilizan más de dos discos, la misma información se almacena en cada disco (todos son idénticos). Es la única forma de garantizar la redundancia de datos cuando tiene menos de tres discos.
RAID 1 a veces mejora el rendimiento de lectura. Algunas implementaciones de RAID 1 leerán de ambos discos para duplicar la velocidad de lectura. Algunos solo leerán de uno de los discos, lo que no proporciona ninguna ventaja de velocidad adicional. Otros leerán los mismos datos de ambos discos, asegurando la integridad de la matriz en cada lectura, pero esto dará como resultado la misma velocidad de lectura que un solo disco.
Por lo general, se usa en servidores pequeños que tienen muy poca expansión de disco, como los servidores de 1RU que solo pueden tener espacio para dos discos o en estaciones de trabajo que requieren redundancia. Debido a su alta sobrecarga de espacio “perdido”, su costo puede ser prohibitivo con unidades de pequeña capacidad, alta velocidad (y alto costo), ya que necesita gastar el doble de dinero para obtener el mismo nivel de almacenamiento utilizable.
El espacio de disco utilizable total es el tamaño del disco más pequeño de la matriz (por ejemplo, 2 discos de 1 TB = 1 TB de espacio).
RAID 1E
los 1E El nivel de RAID es similar a RAID 1 en que los datos siempre se escriben en (al menos) dos discos. Pero a diferencia de RAID1, permite un número impar de discos simplemente intercalando los bloques de datos entre varios discos.
Las características de rendimiento son similares a RAID1, la tolerancia a fallas es similar a RAID 10. Este esquema puede extenderse a números impares de discos de más de tres (posiblemente llamado RAID 10E, aunque rara vez).
RAID 10
Bueno cuando: quieres velocidad y redundancia
Malo cuando: no puede permitirse perder la mitad de su espacio en disco
RAID 10 es una combinación de RAID 1 y RAID 0. El orden del 1 y el 0 es muy importante. Supongamos que tiene 8 discos, creará 4 matrices RAID 1 y luego aplicará una matriz RAID 0 sobre las 4 matrices RAID 1. Requiere al menos 4 discos y los discos adicionales deben agregarse en pares.
Esto significa que un disco de cada par puede fallar. Entonces, si tiene conjuntos A, B, C y D con discos A1, A2, B1, B2, C1, C2, D1, D2, puede perder un disco de cada conjunto (A, B, C o D) y aún tener una matriz en funcionamiento.
Sin embargo, si pierde dos discos del mismo conjunto, la matriz se perderá por completo. Puedes perder hasta (pero no garantizado) 50% de los discos.
Se le garantiza alta velocidad y alta disponibilidad en RAID 10.
RAID 10 es un nivel RAID muy común, especialmente con unidades de alta capacidad en las que una falla en un solo disco hace que sea más probable que falle un segundo disco antes de que se reconstruya la matriz RAID. Durante la recuperación, la degradación del rendimiento es mucho menor que su contraparte RAID 5, ya que solo tiene que leer de una unidad para reconstruir los datos.
El espacio disponible en disco es el 50% de la suma del espacio total. (por ejemplo, 8 unidades de 1 TB = 4 TB de espacio utilizable). Si usa diferentes tamaños, solo se usará el tamaño más pequeño de cada disco.
Vale la pena señalar que el controlador de raid de software del kernel de Linux llamado md
permite configuraciones RAID 10 con una cantidad impar de unidades, es decir, un RAID 10 de 3 o 5 discos.
RAID 01
Bueno cuando: Nunca
Malo cuando: siempre
Es lo contrario de RAID 10. Crea dos matrices RAID 0 y luego coloca un RAID 1 en la parte superior. Esto significa que puede perder un disco de cada conjunto (A1, A2, A3, A4 o B1, B2, B3, B4). Es muy raro verlo en aplicaciones comerciales, pero es posible hacerlo con software RAID.
Para ser absolutamente claro:
- Si tiene una matriz RAID10 con 8 discos y uno muere (lo llamaremos A1), entonces tendrá 6 discos redundantes y 1 sin redundancia. Si muere otro disco, hay un 85% posibilidad de que su matriz todavía esté funcionando.
- Si tiene una matriz RAID01 con 8 discos y uno muere (lo llamaremos A1), entonces tendrá 3 discos redundantes y 4 sin redundancia. Si muere otro disco, hay un 43% posibilidad de que su matriz todavía esté funcionando.
No proporciona velocidad adicional sobre RAID 10, pero sustancialmente menos redundancia y debe evitarse a toda costa.
RAID 5
Bueno cuando: desea un equilibrio de redundancia y espacio en disco o tiene una carga de trabajo de lectura mayoritariamente aleatoria
Malo cuando: tiene una gran carga de trabajo de escritura aleatoria o unidades grandes
RAID 5 ha sido el nivel RAID más utilizado durante décadas. Proporciona el rendimiento del sistema de todas las unidades de la matriz (a excepción de pequeñas escrituras aleatorias, que generan una ligera sobrecarga). Utiliza una operación XOR simple para calcular la paridad. En caso de falla de una sola unidad, la información se puede reconstruir a partir de las unidades restantes utilizando la operación XOR en los datos conocidos.
Desafortunadamente, en el caso de una falla de la unidad, el proceso de reconstrucción es muy intensivo en IO. Cuanto más grandes sean las unidades en el RAID, más tardará la reconstrucción y mayores serán las posibilidades de que falle una segunda unidad. Dado que las unidades de disco grandes y lentas tienen muchos más datos para reconstruir y mucho menos rendimiento para hacerlo, generalmente no se recomienda usar RAID 5 con 7200 RPM o menos.
Quizás el problema más crítico con las matrices RAID 5, cuando se utilizan en aplicaciones de consumo, es que es casi seguro que fallarán cuando la capacidad total supere los 12 TB. Esto se debe a que la tasa de error de lectura irrecuperable (URE) de las unidades de consumo SATA es de uno por cada 1014 bits, o ~ 12,5 TB.
Si tomamos un ejemplo de una matriz RAID 5 con siete unidades de 2 TB: cuando una unidad falla, quedan seis unidades. Para reconstruir la matriz, el controlador necesita leer seis unidades de 2 TB cada una. Al observar la figura anterior, es casi seguro que ocurrirá otro URE antes de que termine la reconstrucción. Una vez que eso sucede, la matriz y todos los datos que contiene son perdió.
- http://www.zdnet.com/article/why-raid-5-stops-working-in-2009
Sin embargo, el problema de URE / pérdida de datos / falla de matriz con RAID 5 en unidades de consumo se ha mitigado un poco por el hecho de que la mayoría de los fabricantes de discos duros han aumentado las calificaciones de URE de sus unidades más nuevas a uno de cada 1015 bits. Como siempre, consulte la hoja de especificaciones antes de comprar.
- https://www.zdnet.com/article/why-raid-5-still-works-usually/
También es imperativo que RAID 5 se coloque detrás de una caché de escritura confiable (respaldada por batería). Esto evita la sobrecarga de las escrituras pequeñas, así como el comportamiento inestable que puede ocurrir en caso de una falla en medio de una escritura.
RAID 5 es la solución más rentable para agregar almacenamiento redundante a una matriz, ya que requiere la pérdida de solo 1 disco (por ejemplo, 12 discos de 146 GB = 1606 GB de espacio utilizable). Requiere un mínimo de 3 discos.
RAID 6
Bueno cuando: desea utilizar RAID 5, pero sus discos son demasiado grandes o lentos
Malo cuando: tiene una gran carga de trabajo de escritura aleatoria
RAID 6 es similar a RAID 5 pero usa dos discos por valor de paridad en lugar de solo uno (el primero es XOR, el segundo es un LSFR), por lo que puede perder dos discos de la matriz sin pérdida de datos. La penalización de escritura es más alta que RAID 5 y tiene un disco menos de espacio.
Vale la pena considerar que eventualmente una matriz RAID 6 encontrará problemas similares a una RAID 5. Las unidades más grandes causan tiempos de reconstrucción mayores y más errores latentes, lo que eventualmente conduce a una falla de toda la matriz y la pérdida de todos los datos antes de que se complete la reconstrucción.
- http://www.zdnet.com/article/why-raid-6-stops-working-in-2019
- http://queue.acm.org/detail.cfm?id=1670144
RAID 50
Bueno cuando: tienes mucho de discos que deben estar en una sola matriz y RAID 10 no es una opción debido a la capacidad
Malo cuando: tiene tantos discos que es posible que se produzcan muchos fallos simultáneos antes de que se complete la reconstrucción o cuando no tiene muchos discos
RAID 50 es un nivel anidado, muy parecido a RAID 10. Combina dos o más matrices RAID 5 y distribuye datos entre ellas en un RAID 0. Esto ofrece rendimiento y redundancia de múltiples discos, siempre que se pierdan varios discos. diferente Matrices RAID 5.
En un RAID 50, la capacidad del disco es nx, donde x es el número de RAID 5 que están divididos. Por ejemplo, si un RAID 50 simple de 6 discos, el más pequeño posible, si tuviera discos de 6x1TB en dos RAID 5 que luego se dividieron para convertirse en RAID 50, tendría 4TB de almacenamiento utilizable.
RAID 60
Bueno cuando: tiene un caso de uso similar al de RAID 50, pero necesita más redundancia
Malo cuando: no tiene una cantidad sustancial de discos en la matriz
RAID 6 es para RAID 60 como RAID 5 es para RAID 50. Esencialmente, tiene más de un RAID 6 que luego se distribuyen en un RAID 0. Esta configuración permite hasta dos miembros de cualquier RAID 6 individual en el conjunto fallar sin pérdida de datos. Los tiempos de reconstrucción de las matrices RAID 60 pueden ser considerables, por lo que suele ser una buena idea tener un repuesto dinámico para cada miembro RAID 6 de la matriz.
En un RAID 60, la capacidad del disco es n-2x, donde x es el número de RAID 6 que están seccionados. Por ejemplo, si un simple RAID 60 de 8 discos, el más pequeño posible, si tuviera discos de 8x1TB en dos RAID 6 que luego se dividieron para convertirse en un RAID 60, tendría 4TB de almacenamiento utilizable. Como puede ver, esto proporciona la misma cantidad de almacenamiento utilizable que proporcionaría un RAID 10 en una matriz de 8 miembros. Si bien RAID 60 sería un poco más redundante, los tiempos de reconstrucción serían sustancialmente mayores. Generalmente, desea considerar RAID 60 solo si tiene una gran cantidad de discos.
RAID-Z
Bueno cuando: está utilizando ZFS en un sistema que lo admite
Malo cuando: el rendimiento exige aceleración RAID por hardware
RAID-Z es un poco complicado de explicar, ya que ZFS cambia radicalmente la forma en que interactúan el almacenamiento y los sistemas de archivos. ZFS abarca las funciones tradicionales de administración de volúmenes (RAID es una función de un administrador de volúmenes) y sistema de archivos. Debido a esto, ZFS puede hacer RAID en el nivel del bloque de almacenamiento del archivo en lugar de en el nivel de la tira del volumen. Esto es exactamente lo que hace RAID-Z, escribe los bloques de almacenamiento del archivo en varias unidades físicas, incluido un bloque de paridad para cada conjunto de bandas.
Un ejemplo puede aclarar esto mucho más. Supongamos que tiene 3 discos en un grupo ZFS RAID-Z, el tamaño del bloque es 4 KB. Ahora escribe un archivo en el sistema que tiene exactamente 16 KB. ZFS lo dividirá en cuatro bloques de 4 KB (como lo haría un sistema operativo normal); luego calculará dos bloques de paridad. Esos seis bloques se colocarán en las unidades de manera similar a cómo RAID-5 distribuiría los datos y la paridad. Esta es una mejora con respecto a RAID5 en el sentido de que no hubo lectura de franjas de datos existentes para calcular la paridad.
Otro ejemplo se basa en el anterior. Digamos que el archivo era solo de 4 KB. ZFS aún tendrá que construir un bloque de paridad, pero ahora la carga de escritura se reduce a 2 bloques. La tercera unidad será gratuita para atender cualquier otra solicitud simultánea. Se verá un efecto similar siempre que el archivo que se está escribiendo no sea un múltiplo del tamaño del bloque del grupo multiplicado por el número de unidades menos uno (es decir, [File Size] <> [Block Size] * [Drives – 1]).
ZFS maneja tanto la administración de volúmenes como el sistema de archivos también significa que no tiene que preocuparse por alinear particiones o tamaños de bloques de bandas. ZFS maneja todo eso automáticamente con las configuraciones recomendadas.
La naturaleza de ZFS contrarresta algunas de las advertencias clásicas de RAID-5/6. Todas las escrituras en ZFS se realizan mediante copia en escritura; todos los bloques modificados en una operación de escritura se escriben en una nueva ubicación en el disco, en lugar de sobrescribir los bloques existentes. Si una escritura falla por cualquier motivo, o el sistema falla a mitad de la escritura, la transacción de escritura ocurre completamente después de la recuperación del sistema (con la ayuda del registro de intenciones de ZFS) o no ocurre en absoluto, evitando la posible corrupción de datos. Otro problema con RAID-5/6 es la posible pérdida de datos o la corrupción silenciosa de los datos durante las reconstrucciones; regular zpool scrub
Las operaciones pueden ayudar a detectar la corrupción de datos o problemas de manejo antes de que causen la pérdida de datos, y la suma de verificación de todos los bloques de datos asegurará que se detecte toda la corrupción durante una reconstrucción.
La principal desventaja de RAID-Z es que sigue siendo una incursión de software (y sufre la misma latencia menor en la que incurre la CPU al calcular la carga de escritura en lugar de dejar que un HBA de hardware la descargue). Esto puede resolverse en el futuro mediante HBA que admitan la aceleración de hardware ZFS.
Otras funciones RAID y no estándar
Debido a que no existe una autoridad central que imponga ningún tipo de funcionalidad estándar, los distintos niveles de RAID han evolucionado y se han estandarizado mediante el uso frecuente. Muchos proveedores han elaborado productos que se desvían de las descripciones anteriores. También es bastante común que inventen una terminología de marketing nueva y elegante para describir uno de los conceptos anteriores (esto sucede con mayor frecuencia en el mercado SOHO). Cuando sea posible, intente que el proveedor describa realmente la funcionalidad del mecanismo de redundancia (la mayoría ofrecerá voluntariamente esta información, ya que ya no hay salsa secreta).
Vale la pena mencionar que existen implementaciones similares a RAID 5 que le permiten iniciar una matriz con solo dos discos. Almacenaría datos en una banda y paridad en la otra, similar al RAID 5 anterior. Esto funcionaría como RAID 1 con la sobrecarga adicional del cálculo de paridad. La ventaja es que puede agregar discos a la matriz recalculando la paridad.
Solucion 2:
También RAID ONE MILLION !!!!
128 discos, por lo que las lecturas serían rápidas, escrituras horribles pero muy confiables, imagino, oh, y obtendría 1/128 del espacio disponible, por lo que no es excelente desde una perspectiva presupuestaria. No hagas esto con memorias USB, lo intenté y prendí fuego a la atmósfera …