Buttercup: a nova IA de código aberto da Trail of Bits que encontra e corrige vulnerabilidades sozinha

Escrito por
Emanuel Negromonte
Emanuel Negromonte é Jornalista, Mestre em Tecnologia da Informação e atualmente cursa a segunda graduação em Engenharia de Software. Com 14 anos de experiência escrevendo sobre...

Uma IA open-source que acha falhas e já entrega o patch.

Se você trabalha com segurança, já deve ter sonhado com um “estagiário incansável” que varre seu repositório, acha os bugs e ainda envia um patch que passa nos testes. Pois é exatamente essa a promessa do Buttercup — um sistema de IA (Inteligência Artificial) de código aberto lançado pela Trail of Bits que não apenas detecta vulnerabilidades, como também gera e valida correções. E não é só marketing: o projeto acabou de conquistar o 2º lugar no prestigiado DARPA AI Cyber Challenge (AIxCC), reforçando sua credibilidade técnica e o impacto potencial para a comunidade.

Por que isso importa?

Porque a manutenção de segurança em projetos open-source é um trabalho sem fim — e, muitas vezes, sem equipe suficiente. Com o Buttercup, a ideia é automatizar o grosso do esforço: ele procura entradas que causam falhas, entende o contexto do código e propõe um patch que resolve o problema sem quebrar o resto. Em outras palavras, “Buttercup AI security” não é só um termo de efeito: é um fluxo completo, do achado ao conserto, pensado para escala. No AIxCC, por exemplo, a Trail of Bits relatou ter encontrado 28 falhas e aplicado 19 patches durante a rodada final — desempenho que ajuda a explicar o pódio.

Como o Buttercup funciona?

Sem jargão: pense nele como um canivete suíço de análise e reparo, com peças que conversam entre si — e com você.

  • Orquestração/UI
    O “maestro” que coordena tudo e mostra, numa interface web, o que foi achado e como está sendo corrigido. Além disso, envia logs e eventos para um servidor de telemetria SigNoz, para você enxergar o que acontece nos bastidores.
  • Descoberta de vulnerabilidades
    Usa uma versão “turbinada por IA” do tradicional fuzzing — em termos simples, o sistema tenta provocar erros com entradas criadas inteligentemente — construído sobre OSS-Fuzz/ClusterFuzz e motores como libFuzzer e Jazzer.
  • Análise contextual
    Antes de sugerir qualquer correção, o Buttercup cria um “mapa detalhado” do programa (com ferramentas como tree-sitter e CodeQuery). Esse mapa dá contexto para as decisões da IA ao caçar falhas e gerar patches.
  • Geração de patches
    Aqui entra o time de sete agentes de LLM trabalhando em conjunto para criar e validar o conserto — a ideia é não apenas “tapar o buraco”, mas garantir que o restante do software continue funcionando.

Curiosidade com cara de futuro: no AIxCC, a equipe recebeu menções como o patch mais longo (>300 linhas) e cobertura ampla de classes de falhas (20 CWEs), mostrando que não se trata só de correções triviais.

Requisitos e custos: o que você precisa saber

Transparência total — especialmente para quem quer experimentar localmente ou planejar a adoção em escala.

  • Pré-requisitos mínimos: CPU com 8 núcleos, 16 GB de RAM e 100 GB livres em disco, além de conexão estável para baixar dependências. Roda bem em um laptop típico com Linux.
  • APIs de LLM pagas: para funcionar, o Buttercup depende de provedores de IA de terceiros (como OpenAI, Anthropic e Google). Isso implica custo por uso — mas há um controle de orçamento embutido para você definir tetos e evitar surpresas.
  • Observabilidade integrada: implantação local do SigNoz para logs, métricas e traces, e suporte a ferramentas como Langfuse para monitorar consumo de LLMs. Em outras palavras, governança de custo e visibilidade operacional vêm no pacote.
  • Disponibilidade e código: o projeto é open-source e está no GitHub com documentação de setup rápido, inclusive um modo “standalone” pensado para indivíduos e equipes pequenas.

E o que vem agora?

Com a chancela do AIxCC e a liberação do código, a bola está com a comunidade. Projetos podem começar a experimentar, ajustar o pipeline aos seus repositórios e, principalmente, medir o custo-benefício: quanto tempo (e incidentes) você economiza quando a máquina faz o trabalho braçal? A Trail of Bits afirma que projetou o Buttercup para ser acessível — em hardware comum e com controles de gasto — justamente para que mantenedores e empresas possam colocar a automação para trabalhar onde dói mais.

Compartilhe este artigo