Para quem não sabe, Big Data é um termo abrangente que se refere a conjuntos de dados tão grandes e complexos que precisam ser processados ??por ferramentas de hardware e software especialmente projetadas. Neste artigo, você conhecerá 14 dos melhores armazenamentos de valores-chave gratuitos e de código aberto para Big Data.
Conjunto de dados
Os conjuntos de dados são normalmente da ordem de tera ou exabytes de tamanho. Estes conjuntos de dados são criados a partir de diversas fontes: sensores que recolhem informações climáticas, informações publicamente disponíveis, como revistas, jornais, artigos.
Outros exemplos de geração de big data incluem registros de transações de compras, registros da web, registros médicos, vigilância militar, arquivos de vídeo e imagens e comércio eletrônico em grande escala.
Na última década, o mundo da computação foi transformado. Oceanos de dados agora não são encontrados apenas em grandes empresas; até mesmo algumas pequenas empresas acumulam terabytes de dados. Portanto, organizações de todos os tamanhos têm uma necessidade crescente de lidar com grandes quantidades de dados, e os bancos de dados relacionais são levados ao limite em termos de escalabilidade. Precisamos de uma solução que ajude a alcançar escalabilidade e maior disponibilidade.
Os sistemas de serviço são incapazes de lidar com conjuntos de dados imutáveis ??massivos de carga em massa sem afetar o desempenho do serviço. O desempenho é prejudicado à medida que recursos valiosos são sugados pela criação e modificação de índices, à medida que recursos de CPU e memória são compartilhados com o atendimento de solicitações.
Uma solução é um armazenamento de valor-chave. Este é um dos modelos de banco de dados não relacionais, como modelos de banco de dados orientados a documentos e gráficos. Os armazenamentos de valores-chave permitem que o aplicativo armazene seus dados sem esquema. Os dados podem ser armazenados em um tipo de dados de uma linguagem de programação ou em um objeto. Isso elimina a necessidade de um modelo de dados fixo. Os armazenamentos de valores-chave referem-se a um conceito geral de banco de dados onde entidades (valores) são indexadas usando uma chave exclusiva.
Abaixo, uma lista com 14 dos melhores armazenamentos de valores-chave gratuitos e de código aberto para Big Data.
Armazenamento de valor-chave
- RocksDB: Armazenamento persistente de valores-chave para armazenamento flash e RAM;
- Apache Cassandra: Sistema de gerenciamento de banco de dados distribuído;
- ScyllaDB: Banco de dados de big data em tempo real;
- KeyDB: Fork de alto desempenho do Redis;
- Apache Accumulo: Baseado no design BigTable do Google;
- Valkey: Servidor de estrutura de dados de alto desempenho;
- ArangoDB: Banco de dados multimodelo nativo;
- Aerospike: CE Banco de dados NoSQL em tempo real e armazenamento de valores-chave;
- Berkeley DB: Família de bancos de dados incorporáveis ??de código aberto;
- LevelDB: Biblioteca de banco de dados de chave/valor rápida e leve do Google;
- Garnet: Armazenamento de cache remoto;
- Redict: Armazenamento de chave/valor distribuído;
- Projet Voldemort: Armazenamento de dados distribuído;
- Scalaris: Armazenamento de chave-valor transacional distribuído.