Kernel Linux ganha driver PMT Discovery da Intel: telemetria, logs de crash e monitoramento de CPU expostos via Sysfs

Escrito por
Emanuel Negromonte
Emanuel Negromonte é Jornalista, Mestre em Tecnologia da Informação e atualmente cursa a segunda graduação em Engenharia de Software. Com 14 anos de experiência escrevendo sobre...

Driver PMT Discovery da Intel chega ao Kernel Linux, expondo recursos avançados de telemetria, logs de crash e monitoramento de CPU via Sysfs para plataformas Intel.

O Kernel Linux acaba de receber um reforço importante no que diz respeito à observabilidade de hardware Intel: o novo PMT Discovery driver, desenvolvido por David E. Box (Intel), foi integrado ao código-fonte do kernel para facilitar a descoberta e a exposição das funcionalidades da Intel Platform Monitoring Technology (PMT).

Essa adição, baseada na especificação PMT 3.0, oferece um avanço significativo para administradores de sistemas, engenheiros de DevOps e especialistas em segurança, ao permitir o acesso direto, via Sysfs, a informações críticas como telemetria da CPU, logs de crash e recursos de gerenciamento de plataforma — tudo de forma organizada e padronizada, diretamente no espaço de usuário do Linux.

Intel Platform Monitoring Technology (PMT): o que é e por que é vital para o Linux

A Intel Platform Monitoring Technology (PMT) é um conjunto de recursos embarcados em processadores e chipsets Intel que permite a coleta granular de dados de telemetria, consumo de energia, logs de falha e outras métricas operacionais em tempo real. Originalmente voltada para ambientes corporativos e datacenters, a tecnologia tem ganhado relevância crescente também em workstations e ambientes de desenvolvimento avançado.

Na prática, o PMT funciona como um canal out-of-band de observabilidade de hardware. Ele possibilita o diagnóstico de anomalias de desempenho, falhas de sistema e otimizações em nível de silício, sem sobrecarregar o sistema operacional com tarefas de monitoramento intensivas.

A importância do monitoramento de plataforma em hardware Intel

Com a complexidade crescente dos data centers modernos, clusters de computação intensiva e infraestruturas em nuvem, torna-se essencial monitorar continuamente a saúde do hardware. Em ambientes com processadores Intel, isso inclui métricas como:

  • Telemetria por núcleo (temperatura, uso, frequência)
  • Energia consumida por unidade funcional
  • Logs de falhas de sistema armazenadas pelo firmware
  • Estado dos recursos de gerenciamento embarcados

O suporte oficial e nativo a esse tipo de monitoramento no Kernel Linux amplia significativamente a capacidade de resposta a falhas, o planejamento de capacidade e a resiliência operacional.

Visão geral da especificação PMT 3.0 Capability

A PMT 3.0 introduz uma especificação unificada para representar as capacidades de monitoramento embarcadas na plataforma Intel. O driver agora integrado ao kernel se baseia especialmente na Seção 6.6 (“Capability”) da documentação oficial da Intel, que define uma tabela de descoberta padronizada para leitura e interpretação dos módulos de gerenciamento da Intel.

Essas tabelas são expostas por meio dos chamados Intel Out of Band Management Services Modules (OOBMSM), que contêm os descritores de funcionalidades como:

  • TPMI (Trusted Platform Management Interface)
  • Telemetry (telemetria detalhada por subsistema)
  • Crash Log (log persistente de falhas)
  • Uncore Telemetry (telemetria de subsistemas fora dos núcleos)

O PMT Discovery driver: enumerando e expondo capacidades via Sysfs

O PMT Discovery driver foi projetado como um mecanismo de descoberta e interfaceamento. Ele mapeia, interpreta e expõe as capacidades do PMT de forma padronizada no sistema de arquivos virtual Sysfs.

Ao detectar um módulo OOBMSM compatível, o driver:

  1. Mapeia fisicamente a memória onde a tabela PMT está armazenada
  2. Lê e valida os dados de capacidade expostos pela plataforma
  3. Cria entradas no /sys/class/intel_pmt/ para cada recurso descoberto

Essa abordagem modular e baseada em discovery permite adaptar-se dinamicamente a diferentes gerações de processadores Intel e suas respectivas capacidades de PMT.

Componentes do driver: discovery.c, features.c e intel_pmt_features.h

A nova funcionalidade é composta por três arquivos principais no kernel:

  • discovery.c: responsável por ler a tabela de capacidades da PMT, validar os dados e identificar os recursos disponíveis.
  • features.c: mapeia cada capacidade detectada para atributos legíveis em user-space, criando os diretórios e arquivos no Sysfs.
  • intel_pmt_features.h: define constantes, identificadores e máscaras para interpretar corretamente os bits de capacidade expostos pelo hardware.

Esse design modular garante a escalabilidade do driver e facilita sua evolução para futuras versões da especificação PMT.

Integração com Sysfs: acesso unificado a dados de telemetria e gerenciamento

Após a detecção dos recursos PMT, o driver cria entradas no Sysfs, um pseudo-sistema de arquivos que permite interação com o kernel a partir do espaço de usuário. Cada dispositivo é representado como uma subpasta em:

/sys/class/intel_pmt/

Os nomes seguem o padrão DBDF (Domain:Bus:Device.Function), como por exemplo:

/sys/class/intel_pmt/features-0000:00:03.1/

Dentro dessa pasta, são criados diretórios e arquivos correspondentes às capacidades PMT detectadas:

  • accelerator_telemetry/
  • per_core_environment_telemetry/
  • per_core_performance_telemetry/
  • per_rmid_energy_telemetry/
  • per_rmid_perf_telemetry/
  • tpmi_control/
  • tracing/
  • uncore_telemetry/

Essas estruturas expõem dados como logs, métricas numéricas e controles específicos de hardware, prontos para consumo por scripts, daemons de observabilidade ou interfaces gráficas.

Exemplos práticos de uso do Sysfs para monitoramento PMT

Para inspecionar, por exemplo, a telemetria de desempenho por núcleo, o administrador pode executar:

cat /sys/class/intel_pmt/features-0000:00:03.1/per_core_performance_telemetry/data

Para acessar o log de crash persistente armazenado na plataforma:

cat /sys/class/intel_pmt/features-0000:00:03.1/crash_log/log

Essas informações podem ser integradas a ferramentas como collectd, Prometheus, Grafana ou até a soluções de RAS (Reliability, Availability, Serviceability).

Benefícios e impacto: otimizando o gerenciamento de sistemas Linux com Intel

O impacto da inclusão do PMT Discovery driver é substancial:

  • Visibilidade profunda e padronizada do estado do hardware Intel, acessível em tempo real
  • Integração facilitada com ferramentas de monitoramento
  • Diagnóstico mais rápido e preciso de falhas e gargalos de desempenho
  • Controle mais granular de funcionalidades como logs de falha e interfaces TPMI
  • Redução da necessidade de agentes proprietários ou binários para coleta de dados de hardware

Simplificando a observabilidade e o diagnóstico de hardware

Em vez de depender de soluções terceirizadas ou pacotes inconsistentes entre plataformas, agora o Kernel Linux oferece um caminho oficial, open source e nativo para acessar os recursos de gerenciamento embarcados da Intel. Isso democratiza o acesso à observabilidade, mesmo para ambientes de menor escala, e fortalece a cadeia de confiança do monitoramento.

Aprimorando a segurança e a confiabilidade de servidores e workstations

Ao expor logs de falha e métricas detalhadas de telemetria, o driver habilita práticas mais avançadas de engenharia de confiabilidade (SRE) e segurança, permitindo:

  • Detecção precoce de falhas de hardware
  • Correlação de eventos de falha com uso intensivo ou comportamento anômalo
  • Auditoria de logs persistentes da plataforma, úteis em análise pós-incidente

O compromisso da Intel com o Kernel Linux e o Open Source

Este driver é mais um passo do comprometimento da Intel com o ecossistema Linux. A empresa tem investido fortemente na upstreamização de drivers e suporte nativo a suas tecnologias, garantindo que os usuários de distribuições Linux modernas possam usufruir do melhor desempenho e controle sobre seus sistemas Intel.

O patch foi escrito por David E. Box, engenheiro da Intel, e revisado por Ilpo Järvinen, também da equipe de desenvolvimento de drivers da empresa. Ambos têm histórico ativo na colaboração com o subsistema platform/x86 do kernel.

Conclusão: o driver PMT Discovery – um novo nível de controle sobre seu hardware Intel no Linux

A inclusão do PMT Discovery driver marca uma evolução importante na relação entre o Linux e o hardware Intel. Ao tornar acessíveis, via Sysfs, funcionalidades críticas de monitoramento, logs e telemetria, o kernel oferece uma fundação poderosa para observabilidade, diagnóstico e gerenciamento de infraestrutura moderna.

Mais do que apenas um novo driver, essa adição representa uma mudança de paradigma na forma como os administradores de sistemas Linux interagem com o hardware, elevando o nível de controle, segurança e eficiência operacional.

Compartilhe este artigo