Turbostat no Linux 7.0: monitoramento de cache L2 e nova organização por CPU

"Raio-X do processador: Turbostat 2026.02.14 abre a 'caixa preta' do cache L2 no Linux 7.0!

Escrito por
Emanuel Negromonte
Emanuel Negromonte é Jornalista, Mestre em Tecnologia da Informação e atualmente cursa a segunda graduação em Engenharia de Software. Com 14 anos de experiência escrevendo sobre...
  • Métricas de cache L2: o Kernel Linux 7.0 agora permite monitorar em tempo real a eficiência do cache L2 (colunas L2MRPS e L2%hit), essencial para diagnosticar gargalos de latência em chips Intel modernos.
  • Organização lógica: a nova versão do turbostat organiza a saída de dados pelo número lógico do processador (cpu#) em vez do núcleo físico, facilitando a leitura em arquiteturas híbridas e com hyper-threading.
  • Detecção de virtualização: a ferramenta agora identifica e exibe automaticamente o nome do hipervisor (KVM, VMware, etc.), ajudando a contextualizar métricas de performance em ambientes de nuvem.
  • Eficiência interna: o código foi otimizado para alocar contadores de média dinamicamente, reduzindo o consumo de memória da ferramenta em servidores com centenas de threads.
  • Refinamento técnico: liderado por Len Brown, o patch fortalece a leitura de registradores MSR e melhora a documentação das flags de linha de comando.

Linus Torvalds confirmou a integração das atualizações da ferramenta turbostat (versão 2026.02.14) ao Kernel Linux 7.0. O utilitário, mantido por Len Brown da Intel e essencial para análise de eficiência energética e frequência de processadores, recebeu melhorias significativas na telemetria de memória cache e na organização visual dos dados.

A mudança reflete a necessidade de adaptar as ferramentas de monitoramento à complexidade crescente das arquiteturas de processadores modernos, especialmente os modelos híbridos da Intel que misturam núcleos de performance e eficiência.

O impacto real no uso diário:

  • Visão profunda do gargalo: administradores de sistemas agora podem ver exatamente como o cache L2 está se comportando. Se o seu servidor está lento, mas o uso de CPU parece normal, uma baixa taxa de acerto no cache L2 (agora visível) pode ser a culpada, indicando que o processador está perdendo tempo esperando dados da memória RAM.
  • Leitura mais intuitiva: a ferramenta parou de ordenar os dados pelo número físico do núcleo (core#) e passou a usar o número lógico do processador (cpu#). Isso alinha a saída do turbostat com o que você vê em ferramentas como htop ou /proc/cpuinfo, facilitando a correlação de dados.

Novas métricas de cache L2

A atualização introduz duas colunas inéditas para processadores Intel recentes, focadas no Cache de Nível 2 (L2), que atua como intermediário crítico entre os núcleos ultrarrápidos e o cache L3 compartilhado:

  • L2MRPS (L2 Cache M-References Per Second): mede a quantidade de vezes (em milhões por segundo) que o processador tenta buscar dados no cache L2. Uma taxa muito alta aqui indica uso intensivo de memória pela aplicação.
  • L2%hit (L2 Cache Hit %): exibe a porcentagem de sucesso dessas buscas. Um valor próximo de 100% é ideal; valores baixos significam que o dado não estava lá e o processador teve que buscá-lo no cache L3 ou na lenta memória RAM, degradando a performance.

Reorganização por CPU lógica

Uma mudança estrutural importante foi a decisão de priorizar o cpu# em vez do core# na ordenação e processamento. Em arquiteturas modernas com Hyper-Threading e designs híbridos (Big.LITTLE ou Performance/Efficient cores), a numeração física dos núcleos pode ser confusa e não linear.

Ao padronizar a exibição pelo índice do CPU lógico, o turbostat simplifica a depuração em ambientes com centenas de threads, garantindo que a visualização siga a mesma lógica do agendador de tarefas do kernel do Linux.

Detecção de ambiente e limpeza de código

O ciclo 2026.02.14 também traz refinamentos técnicos sob o capô:

  • Identificação de hipervisor: a ferramenta agora é capaz de despejar o nome do hipervisor (como KVM, VMware ou Hyper-V) ao ler as flags de CPUID. Isso é vital para entender se anomalias de energia são causadas pelo hardware real ou pela camada de virtualização.
  • Alocação dinâmica: contadores de média agora são alocados dinamicamente, otimizando o uso de memória da própria ferramenta em sistemas de grande porte.
  • Enumeração de HT aprimorada: a detecção de pares de Hyper-Threading foi melhorada para lidar com topologias onde a relação entre núcleos lógicos e físicos não é padrão.
Compartilhe este artigo
Emanuel Negromonte é Jornalista, Mestre em Tecnologia da Informação e atualmente cursa a segunda graduação em Engenharia de Software. Com 14 anos de experiência escrevendo sobre GNU/Linux, Software Livre e Código Aberto, dedica-se a descomplicar o universo tecnológico para entusiastas e profissionais. Seu foco é em notícias, tutoriais e análises aprofundadas, promovendo o conhecimento e a liberdade digital no Brasil.