A IA está em alta depois do lançamento do ChatGPT. Inclusive, algumas empresas já buscam uma alternativa para esta tecnologia, que seja mais barata e de código aberto. E, parece que já temos uma alternativa mais barata ao ChatGPT, na forma da Dolly, IA da Databricks.
Databricks é uma empresa de software que se estabeleceu em vários setores, com data warehousing e soluções baseadas em IA sendo seu foco principal. Nos últimos tempos, vimos a ascensão meteórica do ChatGPT, resultando em esforços semelhantes de empresas como Meta, Google e até Mozilla. E agora, a Databricks está tentando, à sua maneira, abrir o código de seu modelo de linguagem grande (LLM) “Dolly”.
Dolly pode ser uma alternativa de código aberto ao ChatGPT
Em um anúncio recente, a Databricks apresentou o que eles chamam de LLM “barato de construir” que funciona usando um modelo de parâmetro de código aberto existente da EleutherAI. O modelo foi ligeiramente ajustado para dar instruções a Dolly seguindo recursos como brainstorming e geração de texto.
Quando você compara os 175 bilhões de parâmetros no GPT-3, os 6 bilhões de parâmetros de Dolly podem parecer insignificantes em comparação. Mas o pessoal da Databricks ficou surpreso ao ver que, mesmo com tantos dados, Dolly conseguiu exibir muitos dos mesmos recursos do ChatGPT.
Abaixo está um dos exemplos que eles mostraram:
O modelo original usava dados da Alpaca, o modelo construído por Stanford usando o LLaMA LLM da Meta como base. Mas, o modelo original produziu um resultado muito aleatório, enquanto Dolly, com seu modelo diferente e ajustes, foi capaz de produzir uma resposta bastante utilizável (mensagem em inglês).
IA de código aberto
De acordo com a Databricks, eles acham que muitas empresas preferem construir seu próprio modelo em vez de enviar dados para algum provedor centralizado que bloqueou seu modelo atrás de uma API.
Muitas empresas podem não se sentir à vontade para entregar seus dados mais confidenciais a terceiros, e há várias compensações em termos de qualidade do modelo, custo e comportamento desejado.
Você terá que usar a plataforma deles para usar o Dolly, eles abriram um notebook Databricks de código aberto que o ajudará a construí-lo no Databricks. Além disso, se você deseja obter acesso aos pesos treinados, deverá contatá-los. No entanto, não tenho certeza se eles fornecerão acesso a ele gratuitamente.
Em poucas palavras, essa mudança para o modelo de código aberto deve ser bom para as empresas ajudarem a proteger seus dados, economizar em custos operacionais e muito mais, permitindo que criem seu próprio modelo.