OpenAI lança o GPT-5: um salto em inteligência com “raciocínio profundo” e menos alucinações

Escrito por
Emanuel Negromonte
Emanuel Negromonte é Jornalista, Mestre em Tecnologia da Informação e atualmente cursa a segunda graduação em Engenharia de Software. Com 14 anos de experiência escrevendo sobre...

O novo padrão do ChatGPT: inteligência unificada, raciocínio profundo e menos alucinações.

A OpenAI apresentou hoje o GPT-5, descrito pela própria empresa como seu modelo “mais inteligente, rápido e útil até agora”. Mais do que um upgrade incremental, o OpenAI GPT-5 inaugura uma arquitetura de inteligência unificada: um sistema com “roteador” que decide, em tempo real, quando responder de forma imediata e quando acionar um modo de raciocínio profundo (GPT-5 thinking) para mergulhar em problemas difíceis. Na prática, isso significa respostas de nível especialista onde importa — e economia de tempo quando não é necessário pensar demais.

Um sistema unificado e inteligente

O GPT-5 opera como um “orquestrador” entre três componentes:

  1. um modelo veloz para a maioria das conversas do dia a dia;
  2. um modelo de raciocínio profundo (GPT-5 thinking) para tarefas complexas;
  3. um roteador que escolhe automaticamente qual usar, lendo sinais como tipo de conversa, complexidade, necessidade de ferramentas e até instruções explícitas do usuário (por exemplo, “think hard about this”).

Esse roteador é treinado continuamente com sinais reais: quando usuários trocam de modelo, taxas de preferência por respostas e medidas de correção. Se o usuário atinge limites de uso, uma versão mini de cada modelo assume para manter a experiência fluida. A OpenAI diz ainda planejar integrar tudo em um único modelo no futuro — a visão de uma IA que administra sozinha o “quanto pensar” em cada tarefa.

Disponibilidade e acesso. O GPT-5 passa a ser o padrão no ChatGPT, substituindo gerações anteriores. Todos podem usar, mas os assinantes Plus e Pro têm cotas maiores; o GPT-5 Pro oferece raciocínio estendido para as tarefas mais exigentes. O rollout começa hoje para Free, Plus, Pro e Team; Enterprise e Edu chegam na sequência. Para desenvolvedores, o GPT-5 já pode ser usado no Codex CLI com login do ChatGPT.

Um salto gigante em codificação, escrita e saúde

A OpenAI enfatiza três áreas em que os ganhos de utilidade são mais visíveis — e onde os usuários comuns sentem a diferença no cotidiano.

Para desenvolvedores: de “ideia” a app em um prompt

O GPT-5 é o modelo de codificação mais forte da OpenAI. Ele melhora especialmente em geração de front-end complexo e debug de repositórios grandes, com sensibilidade estética (espaçamento, tipografia, uso de “white space”). Em benchmarks de referência, o salto é expressivo:

  • SWE-bench Verified: 74,9% (pass@1) — avanço substancial sobre gerações anteriores.
  • Aider Polyglot: 88,0% (pass@2) — edição de código multilíngue.

Na prática: sites, apps e joguinhos “bonitos e responsivos” surgem com um único prompt, reduzindo o trabalho manual de cola/recorta e refinando o acabamento visual de primeira.

Para escritores: colaboração com densidade literária

Em escrita criativa, o GPT-5 mostra maior domínio de forma e ritmo — lidando melhor com estruturas ambíguas, verso livre e até pentâmetro iâmbico sem rima. A própria OpenAI ilustra isso com um pedido de poema sobre uma viúva em Kyoto que encontra as meias do marido: o GPT-4o entrega uma narrativa mais previsível; o GPT-5 oferece imagens nítidas e um desfecho mais impactante (como as “bandeiras negras de um país que não existe mais”), demonstrando economia verbal e contundência emocional. Resultado: melhor coautoria para rascunhos, relatórios, e-mails e textos que exigem “voz” — não apenas correção gramatical.

Para todos: respostas mais seguras e úteis em saúde

Em saúde, o GPT-5 se sai melhor em avaliações realistas e desafiadoras: HealthBench (conversas realistas) e HealthBench Hard (casos difíceis). A OpenAI reporta uma queda acentuada de alucinações e um comportamento mais proativo: o modelo faz perguntas, sinaliza riscos e adapta explicações ao contexto, conhecimento do usuário e geografia. Importante: o ChatGPT não substitui profissionais de saúde — a proposta é servir de parceira para entender resultados, preparar consultas e pesar opções.

Números que importam (sem virar “tabela de campeonato”)

  • Matemática: AIME 2025 (sem ferramentas): 94,6% — novo patamar em competição de raciocínio matemático.
  • Programação: SWE-bench Verified: 74,9%; Aider Polyglot: 88,0%.
  • Multimodal: MMMU: 84,2%; desempenho superior em raciocínio visual e sobre vídeo.
  • Saúde: HealthBench Hard: 46,2%, com menos alucinações que modelos anteriores.

Mais seguro, rápido e confiável

Menos alucinações, mais honestidade

O GPT-5 reduz em cerca de 45% os erros factuais versus GPT-4o; com raciocínio ligado, as respostas ficam ~80% menos propensas a erro do que o3. A OpenAI também mediu decepção (quando o modelo “inventa” ter feito algo impossível): com raciocínio, o GPT-5 diminui essas ocorrências na comparação com o o3 — incluindo cenários com imagens ausentes em benchmarks multimodais, onde o o3 antes respondia com confiança a conteúdo inexistente.

Além disso, a OpenAI diz ter cortado pela metade o comportamento “bajulador” (sycophancy) observado em atualizações passadas: de 14,5% para menos de 6%, mantendo a satisfação do usuário. Na experiência, o GPT-5 é menos efusivo e mais direto quando precisa ser — e mais claro sobre limites quando uma tarefa não pode ser feita no ambiente disponível.

“Safe completions”: o novo paradigma de segurança

No lugar de recusar de imediato (o antigo padrão), o GPT-5 traz conclusões seguras (safe completions): ele tenta ajudar dentro de limites. Em domínios de uso dual (p. ex., biociências), isso significa responder em alto nível quando apropriado, parcialmente quando necessário, e recusar com transparência quando ultrapassa o limiar de segurança — oferecendo alternativas seguras. Em testes internos e na prática, essa abordagem reduz recusas desnecessárias e melhora a utilidade sem abrir mão de responsabilidade.

A OpenAI também tratou o GPT-5 thinking como de alta capacidade em biologia/química, ativando um “safety stack” robusto (classificadores sempre ativos, monitores de raciocínio e fluxos de aplicação) e realizando 5.000 horas de red-teaming com parceiros como CAISI e UK AISI — parte do Preparedness Framework.

Mais velocidade com menos “tokens”

Outra mudança relevante é a eficiência no raciocínio: em diversas tarefas (raciocínio visual, codificação “agente”, ciência em nível de pós-graduação), o GPT-5 (com thinking) atinge maior acurácia que o o3 usando 50–80% menos tokens de saída. Em termos práticos, respostas melhores, mais rápidas e mais baratas para quem paga por token — e mais responsividade no uso cotidiano.

Personalização sem “prompt de 3 km”

Graças ao melhor seguimento de instruções, o ChatGPT ganhou quatro personalidades em prévia de pesquisa — Cynic, Robot, Listener e Nerd — ajustáveis nas configurações. Elas herdam as melhorias de “steerability” do modelo, mantendo o controle contra sycophancy. Para equipes, isso ajuda a padronizar tom e formato de respostas sem engenharia de prompt extensa.

O que muda para cada público

  • Desenvolvedores:
    • Geração de front-ends elegantes em um único prompt;
    • Debug de bases grandes com mais contexto;
    • Melhor coordenação com ferramentas (funções, navegação, terminal).
  • Escritores e profissionais de conteúdo:
    • Coprodução com densidade literária real;
    • Reescrita com voz consistente e respeito à forma;
    • Melhores “briefings” e resumos com menor taxa de erro.
  • Usuários em geral (especialmente saúde):
    • Menos alucinações e explicações que se adaptam ao seu nível;
    • Ajuda para entender exames e formular perguntas ao médico;
    • Mais honestidade sobre limites e impossibilidades.

GPT-5 Pro: quando “pensar muito” é obrigatório

Para tarefas extremamente complexas, a OpenAI lança o GPT-5 Pro, sucessor direto do o3-pro. É a versão que “pensa por mais tempo” (com compute de teste em paralelo, porém eficiente) e atinge estado da arte em desafios como GPQA (perguntas de ciência de alto nível). Em avaliações com mais de mil tarefas de raciocínio valiosas economicamente, especialistas preferiram o GPT-5 Pro em 67,8% dos casos, com 22% menos erros graves — desempenho especialmente forte em saúde, ciência, matemática e código.

Em síntese: o OpenAI GPT-5 não é só “mais um modelo mais rápido”. É uma mudança de arquitetura — um sistema que atua como especialista quando necessário, economiza esforço quando não e fala com mais responsabilidade. Com quedas claras em alucinações, melhor seguimento de instruções e um paradigma de segurança mais maduro, o GPT-5 empurra a IA alguns passos à frente do que já era considerado “estado da arte” — e transforma essa excelência técnica em utilidade diária para desenvolvedores, escritores e usuários comuns.

Compartilhe este artigo