Os agentes de IA para programação estão mudando rapidamente a forma como desenvolvedores escrevem, revisam e executam código. Ferramentas como Claude Code, GitHub Copilot e outros assistentes inteligentes já conseguem automatizar tarefas complexas, reduzir o tempo de desenvolvimento e até corrigir problemas sem intervenção humana. Porém, essa autonomia também amplia a superfície de ataque e cria riscos que vão além das vulnerabilidades tradicionais.
Uma pesquisa apresentada pela Mozilla 0DIN revelou uma técnica conceitual que demonstra como agentes de codificação baseados em inteligência artificial podem ser induzidos a executar malware, mesmo quando o repositório do GitHub aparentemente não contém nenhum código malicioso. Em vez de explorar falhas de software, o ataque manipula a própria lógica utilizada pelos agentes para resolver erros automaticamente.
Neste artigo, você entenderá como funciona essa técnica, por que ela representa uma mudança importante no cenário da segurança da informação e quais medidas podem reduzir os riscos ao utilizar ferramentas de IA na programação.
Como funciona o ataque contra agentes de programação
O diferencial da pesquisa da Mozilla 0DIN é mostrar que o ataque não depende de um exploit tradicional nem de um código claramente malicioso hospedado no GitHub. Toda a estratégia explora o comportamento esperado dos agentes de IA para programação, que normalmente tentam resolver problemas encontrados durante a configuração de um projeto.
Na prática, o atacante cria uma sequência cuidadosamente planejada para fazer com que a IA tome decisões consideradas “naturais” dentro do fluxo de desenvolvimento.

A ilusão do repositório inofensivo
O primeiro passo consiste em criar um repositório aparentemente legítimo.
Ao analisar seus arquivos, não há scripts maliciosos, binários suspeitos ou comandos perigosos. O código parece limpo e pode até passar por auditorias superficiais.
Esse detalhe é importante porque muitos desenvolvedores, e até ferramentas automatizadas, associam segurança à ausência de malware explícito no repositório. Nesse caso, porém, a ameaça não está armazenada no projeto, mas no comportamento induzido durante sua execução.
Essa abordagem dificulta a identificação do problema por scanners convencionais, uma vez que praticamente não existe uma assinatura maliciosa para detectar.
A indução ao erro e o comando de inicialização
Após o clone do projeto, o ambiente é preparado para produzir um erro aparentemente legítimo durante sua inicialização.
Os agentes automatizados de IA foram projetados justamente para interpretar mensagens de erro e tentar corrigi-las sem depender do usuário.
É nesse momento que acontece a manipulação.
Ao interpretar o erro como um problema comum de configuração, o agente executa comandos sugeridos para restaurar o funcionamento do projeto. Para a IA, trata-se apenas de seguir um processo normal de resolução de falhas.
Do ponto de vista do usuário, tudo parece coerente. O agente está apenas tentando concluir sua tarefa.
O truque do registro DNS
O elemento mais inovador da pesquisa envolve o uso de registros TXT de DNS.
Em vez de armazenar comandos maliciosos dentro do repositório do GitHub, o atacante mantém as instruções em registros TXT publicados em um domínio controlado por ele.
Quando o agente executa determinado comando durante a tentativa de corrigir o erro, ele consulta esses registros DNS e recebe dinamicamente novas instruções.
Isso oferece diversas vantagens ao invasor.
Primeiro, os comandos podem ser alterados a qualquer momento sem modificar o repositório público.
Segundo, o projeto continua aparentemente limpo, dificultando auditorias de segurança.
Terceiro, a infraestrutura maliciosa permanece separada do código distribuído, reduzindo as chances de detecção automática.
Na prática, o DNS deixa de ser apenas um serviço de resolução de nomes e passa a funcionar como um canal discreto para distribuir comandos em tempo real.
Os riscos dos agentes de IA para programação para o ambiente local
Se a cadeia de execução for concluída com sucesso, o atacante pode obter um shell interativo executado com os mesmos privilégios do usuário que iniciou o agente de IA.
Embora isso não represente automaticamente o comprometimento completo do sistema operacional, os impactos podem ser extremamente relevantes.
Entre os principais riscos estão:
- Roubo de chaves de API armazenadas no ambiente de desenvolvimento.
- Exfiltração de tokens de acesso.
- Leitura de variáveis de ambiente contendo credenciais.
- Acesso a repositórios privados.
- Comprometimento de certificados e chaves SSH.
- Roubo de credenciais utilizadas em pipelines de CI/CD.
- Movimentação lateral dentro da infraestrutura corporativa.
Em muitos ambientes modernos, um desenvolvedor possui acesso privilegiado a diversos serviços críticos. Consequentemente, comprometer sua estação de trabalho pode representar um ponto de entrada para ataques muito maiores.
O estudo também chama atenção para um aspecto importante: quanto maior a autonomia concedida às ferramentas de IA para codificação, maior será a necessidade de mecanismos que permitam auditar cada ação executada automaticamente.
Como mitigar essa nova ameaça nos agentes de IA para programação
A pesquisa da Mozilla 0DIN não conclui que os agentes de IA sejam inseguros por natureza. Em vez disso, mostra que novos modelos de ameaça precisam ser considerados à medida que essas ferramentas recebem mais autonomia.
Entre as principais recomendações destacam-se:
- Executar agentes em ambientes isolados (sandbox), limitando seu acesso ao sistema operacional.
- Utilizar o princípio do menor privilégio, evitando permissões desnecessárias.
- Exigir transparência na cadeia de execução, permitindo que o usuário visualize exatamente quais comandos serão executados.
- Restringir acessos externos automáticos durante processos de configuração.
- Monitorar consultas inesperadas a registros TXT de DNS.
- Revisar comandos sugeridos pela IA antes de autorizá-los.
- Implementar mecanismos de auditoria capazes de registrar todas as ações realizadas pelo agente.
Outra boa prática consiste em tratar agentes inteligentes da mesma forma que qualquer ferramenta capaz de executar comandos automaticamente: eles devem operar sob políticas claras de segurança, monitoramento e controle de privilégios.
Conclusão
O estudo da Mozilla 0DIN evidencia que a próxima geração de ameaças pode explorar menos vulnerabilidades de software e mais o comportamento inteligente das ferramentas automatizadas.
Nesse cenário, repositórios aparentemente confiáveis deixam de ser uma garantia absoluta de segurança. O verdadeiro risco passa a estar na forma como os agentes de IA para programação interpretam erros, seguem instruções e executam ações de maneira autônoma.
À medida que plataformas como Claude Code e outros assistentes evoluem, será fundamental equilibrar produtividade e segurança. Transparência, isolamento dos ambientes de execução e validação humana continuarão sendo elementos indispensáveis para reduzir riscos.
A inteligência artificial já se tornou uma aliada poderosa no desenvolvimento de software, mas confiar cegamente em qualquer automação pode abrir espaço para novas categorias de ataques que ainda estão sendo compreendidas pela comunidade de segurança.
