Buttercup: a nova IA de código aberto da Trail of Bits que encontra e corrige vulnerabilidades sozinha

Uma IA open-source que acha falhas e já entrega o patch.

Escrito por
Emanuel Negromonte
Emanuel Negromonte é Jornalista, Mestre em Tecnologia da Informação e atualmente cursa a segunda graduação em Engenharia de Software. Com 14 anos de experiência escrevendo sobre...

Se você trabalha com segurança, já deve ter sonhado com um “estagiário incansável” que varre seu repositório, acha os bugs e ainda envia um patch que passa nos testes. Pois é exatamente essa a promessa do Buttercup — um sistema de IA (Inteligência Artificial) de código aberto lançado pela Trail of Bits que não apenas detecta vulnerabilidades, como também gera e valida correções. E não é só marketing: o projeto acabou de conquistar o 2º lugar no prestigiado DARPA AI Cyber Challenge (AIxCC), reforçando sua credibilidade técnica e o impacto potencial para a comunidade.

Por que isso importa?

Porque a manutenção de segurança em projetos open-source é um trabalho sem fim — e, muitas vezes, sem equipe suficiente. Com o Buttercup, a ideia é automatizar o grosso do esforço: ele procura entradas que causam falhas, entende o contexto do código e propõe um patch que resolve o problema sem quebrar o resto. Em outras palavras, “Buttercup AI security” não é só um termo de efeito: é um fluxo completo, do achado ao conserto, pensado para escala. No AIxCC, por exemplo, a Trail of Bits relatou ter encontrado 28 falhas e aplicado 19 patches durante a rodada final — desempenho que ajuda a explicar o pódio.

Como o Buttercup funciona?

Sem jargão: pense nele como um canivete suíço de análise e reparo, com peças que conversam entre si — e com você.

  • Orquestração/UI
    O “maestro” que coordena tudo e mostra, numa interface web, o que foi achado e como está sendo corrigido. Além disso, envia logs e eventos para um servidor de telemetria SigNoz, para você enxergar o que acontece nos bastidores.
  • Descoberta de vulnerabilidades
    Usa uma versão “turbinada por IA” do tradicional fuzzing — em termos simples, o sistema tenta provocar erros com entradas criadas inteligentemente — construído sobre OSS-Fuzz/ClusterFuzz e motores como libFuzzer e Jazzer.
  • Análise contextual
    Antes de sugerir qualquer correção, o Buttercup cria um “mapa detalhado” do programa (com ferramentas como tree-sitter e CodeQuery). Esse mapa dá contexto para as decisões da IA ao caçar falhas e gerar patches.
  • Geração de patches
    Aqui entra o time de sete agentes de LLM trabalhando em conjunto para criar e validar o conserto — a ideia é não apenas “tapar o buraco”, mas garantir que o restante do software continue funcionando.

Curiosidade com cara de futuro: no AIxCC, a equipe recebeu menções como o patch mais longo (>300 linhas) e cobertura ampla de classes de falhas (20 CWEs), mostrando que não se trata só de correções triviais.

Requisitos e custos: o que você precisa saber

Transparência total — especialmente para quem quer experimentar localmente ou planejar a adoção em escala.

  • Pré-requisitos mínimos: CPU com 8 núcleos, 16 GB de RAM e 100 GB livres em disco, além de conexão estável para baixar dependências. Roda bem em um laptop típico com Linux.
  • APIs de LLM pagas: para funcionar, o Buttercup depende de provedores de IA de terceiros (como OpenAI, Anthropic e Google). Isso implica custo por uso — mas há um controle de orçamento embutido para você definir tetos e evitar surpresas.
  • Observabilidade integrada: implantação local do SigNoz para logs, métricas e traces, e suporte a ferramentas como Langfuse para monitorar consumo de LLMs. Em outras palavras, governança de custo e visibilidade operacional vêm no pacote.
  • Disponibilidade e código: o projeto é open-source e está no GitHub com documentação de setup rápido, inclusive um modo “standalone” pensado para indivíduos e equipes pequenas.

E o que vem agora?

Com a chancela do AIxCC e a liberação do código, a bola está com a comunidade. Projetos podem começar a experimentar, ajustar o pipeline aos seus repositórios e, principalmente, medir o custo-benefício: quanto tempo (e incidentes) você economiza quando a máquina faz o trabalho braçal? A Trail of Bits afirma que projetou o Buttercup para ser acessível — em hardware comum e com controles de gasto — justamente para que mantenedores e empresas possam colocar a automação para trabalhar onde dói mais.

Compartilhe este artigo