Nós escrevemos alguns tutoriais sobre RAID e neles há apenas instruções para serem seguidas. No entanto, resolvemos escrever e atualizar este artigo para explicar o que é o RAID, alguns exemplos sobre como ele pode ser aplicado. Assim, esperamos que você compreenda o que é, e você poder tirar proveito deste meio que não é muito novo, mas que ainda é utilizado por muitos. Além disso, temos um tutorial para configurar o RAID 0 no Ubuntu Linux via software. No entanto, este tutorial de configuração funciona em qualquer Linux, é lógica é a mesma!

Contents

O que é RAID ?História do RAID Como RAID funciona?Níveis de RAID Vantagens do RAID Desvantagens do RAID O futuro do RAID Conclusões finais

O que é RAID ?

RAID é um meio de se criar um subsistema de armazenamento composto por vários discos individuais, com a finalidade de ganhar segurança por meio da redundância de dados e desempenho. Popularmente, RAID seriam dois ou mais discos.

História do RAID

O termo RAID foi cunhado em 1987 por David Patterson, Randy Katz e Garth A. Gibson. Em seu relatório técnico de 1988, “Redundant Array of Inexpensive Drives (RAID)” ou numa tradução livre Matriz Redundante de Discos Independentes. Os três argumentaram que uma série de unidades de baixo custo poderiam vencer o desempenho das unidades de disco superiores da época. Ao utilizar redundância, uma matriz RAID pode ser mais confiável do que qualquer unidade de disco.

Embora este relatório tenha sido o primeiro a introduzir este conceito, o uso de discos redundantes já estava sendo discutido por outros. Temos Norman Ken Ouchi, da IBM, que apresentou uma patente em 1977 para a tecnologia, que mais tarde foi chamada RAID 4.

Já em 1983, a Digital Equipment Corp. enviou as unidades que se tornariam RAID 1 e, em 1986, outra patente da IBM foi arquivada para o que seria RAID 5. Patterson, Katz e Gibson também analisaram o que estava sendo feito por empresas como Tandem Computers, Thinking Machines e Maxstor para definir suas taxonomias RAID.

Enquanto os níveis de RAID listados no relatório de 1988, essencialmente, colocavam nomes para tecnologias que já estavam em uso, a criação de terminologia comum para o conceito ajudou a estimular o mercado de armazenamento de dados a desenvolver mais produtos RAID. De acordo com Katz, o termo barato no acrônimo foi substituído por independentes por fornecedores da indústria devido às implicações de baixos custos.

Como RAID funciona?

O RAID funciona colocando dados em vários discos e permitindo que as operações de entrada / saída (I/O) se sobreponham de forma equilibrada, melhorando o desempenho. Como o uso de vários discos aumenta o tempo médio entre falhas (MTBF). Da mesma forma que o armazenamento de dados de forma redundante também aumenta a tolerância a falhas.

Matrizes RAID aparecem no sistema operacional (SO) como um único disco rígido lógico. O RAID emprega as técnicas de espelhamento de disco ou striping de disco. O espelhamento copia dados idênticos em mais de uma unidade. Disparando partições do espaço de armazenamento de cada unidade em unidades que variam de um setor (512 bytes) a vários megabytes. As listras de todos os discos são entrelaçadas e endereçadas em ordem.

Em um sistema de usuário único onde grandes registros, como imagens médicas ou outras imagens científicas, são armazenados, as listras são normalmente configuradas para serem pequenas (talvez 512 bytes) para que um único registro abranja todos os discos e possa ser acessado rapidamente fazendo assim com que todos os discos sejam lidos em simultâneo.

Em um sistema multiusuário, um melhor desempenho exige que você estabeleça uma faixa ampla o suficiente para manter o registro de tamanho típico ou máximo, permitindo sobreposição do I/O de disco em unidades.

Níveis de RAID

No artigo de 1988 que cunhou o termo e cimentou o conceito, os autores distinguiram seis níveis de RAID que vão de 0 a 5. Este sistema numerado permitiu que eles diferenciassem as versões e como eles usariam a redundância e espalhariam dados pela matriz. O número de níveis desde então expandiu e foi dividido em três categorias: níveis de RAID padrão, aninhados e não padronizados.

Vantagens do RAID

Desempenho, resiliência e custo estão entre os principais benefícios do RAID. Ao colocar vários discos rígidos juntos, o RAID pode melhorar o trabalho de um único disco rígido e, dependendo de como ele está configurado, pode aumentar a velocidade e confiabilidade do computador após uma falha.

Com o RAID 0, os arquivos são divididos e distribuídos em unidades que funcionam juntas no mesmo arquivo. Como tal, as leituras e gravações podem ser realizadas mais rapidamente do que com uma única unidade. As matrizes RAID 5 dividem os dados em seções, mas também dedicam outra unidade à paridade.

Esta unidade de semelhança pode ver o que está funcionando quando uma unidade de não-semelhante falha e pode descobrir o que estava na unidade defeituosa. Esta função permite que o RAID forneça maior disponibilidade. Com o espelhamento, as matrizes RAID podem ter duas unidades que contêm os mesmos dados, garantindo que uma continue a funcionar se a outra falhar.

Embora o termo barato tenha sido removido do acrônimo, o RAID ainda pode resultar em custos mais baixos, usando discos de baixo preço em grande número.

Desvantagens do RAID

Os níveis de RAID aninhados são mais caros de implementar do que os níveis tradicionais de RAID, porque requerem um maior número de discos. O custo por GB de armazenamento também é maior para RAID aninhado porque muitas unidades são usadas para redundância. O RAID aninhado tornou-se popular apesar do seu custo porque ajuda a superar alguns dos problemas de confiabilidade associados aos níveis RAID padrão.

Inicialmente, todas as unidades em uma matriz RAID estão instaladas em simultâneo. Isso faz com que as unidades tenham a mesma idade e sujeitas às mesmas condições de operação e quantidade de desgaste. Mas quando uma unidade falha, existe uma grande probabilidade de que outra unidade na matriz também falhe em breve.

Alguns níveis de RAID (como RAID 5 e RAID 1) só podem suportar uma única falha na unidade. Embora algumas implementações de RAID 1 consistam em vários espelhos, portanto, podem suportar várias falhas. O problema é que a matriz RAID e os dados que contém são deixados em um estado vulnerável até que uma unidade com falha seja substituída e o novo disco, seja preenchido com dados.

Como as unidades têm uma capacidade muito maior agora do que quando o RAID foi implementado pela primeira vez, leva-se muito mais tempo para reconstruir unidades com falhas. Assim, os tempos de reconstrução mais longos aumentam a chance de uma segunda unidade falhar antes da reconstrução da primeira unidade.

Mesmo que uma segunda falha do disco não ocorra enquanto o disco com falha está sendo substituído, há uma chance dos discos restantes poderem conter setores defeituosos ou dados ilegíveis. Esses tipos de condições podem impossibilitar a reconstrução completa da matriz.

Os níveis de RAID aninhados solucionam esses problemas, proporcionando um maior grau de redundância, diminuindo consideravelmente as chances de uma falha no nível da matriz devido a falhas de disco simultâneas.

O futuro do RAID

RAID não está completamente morto, mas muitos analistas dizem que a tecnologia tornou-se obsoleta nos últimos anos. Alternativas como a codificação de apagamento oferecem melhor proteção de dados (embora a um preço mais alto).

Assim como foram desenvolvidas com a intenção de abordar as fraquezas do RAID. À medida que a capacidade da unidade aumenta, o mesmo acontece com a chance de erro com uma matriz RAID e as capacidades estão aumentando consistentemente.

O aumento das unidades de estado sólido (SSDs) também é visto como aliviando a necessidade de RAID. Os SSDs não possuem partes móveis e não falham sempre como as unidades de disco rígido. As matrizes SSD geralmente usam técnicas como nivelamento de desgaste em vez de confiar no RAID para proteção de dados. A computação Hyperscale também remove a necessidade de RAID usando servidores redundantes em vez de unidades redundantes.

Ainda assim, o RAID continua sendo parte integrante do armazenamento de dados e dos principais fornecedores de tecnologia. A IBM lançou o IBM Distributed RAID com o Spectrum Virtualize V7.6, que promete impulsionar o desempenho do RAID.

A versão mais recente da Intel Rapid Storage Technology suporta RAID 0, RAID 1, RAID 5 e RAID 10. Da mesma forma que o software de gerenciamento NetApp ONTAP usa RAID para proteger contra até três falhas de unidade simultâneas. A plataforma Dell EMC Unity também suporta RAID 1/0, RAID 5 e RAID 6.

Conclusões finais

Acima está um ótimo artigo da SearchStorage mantida pela TechTarget, este artigo é de fundamental importância para compreensão do nosso próximo assunto que será FreeNAS. Acompanhe também a série sobre BSD e suas tecnologias para melhor um melhor entendimento. É imprescindível desses determinados termos e tecnologias antes de irmos mais fundo em soluções de mercado que utilizam em algum nível o BSD.