Conheça 6 ferramentas de monitoramento de GPU NVIDIA gratuitas e de código aberto

conheca-6-ferramentas-de-monitoramento-de-gpu-nvidia-gratuitas-e-de-codigo-aberto

O Linux conta com uma ferramenta muito limitada para monitoramento e gerenciamento de GPU NVIDIA. Neste artigo, você conhecerá 6 ferramentas de monitoramento de GPU NVIDIA gratuitas e de código aberto que podem ser a saída para um excelente monitoramento e gerenciamento.

NVSM no Linux

O nvidia-smi ou NVSM fornece recursos de monitoramento e gerenciamento para cada um dos dispositivos Tesla, Quadro e GRID da NVIDIA da Fermi e famílias de arquitetura superior. Informações muito limitadas também são fornecidas para dispositivos GeForce. Ele é baseado na NVIDIA Management Library (NVML), que ajuda os usuários a gerenciar e monitorar os dispositivos NVIDIA GPU.

NVSMI é uma ferramenta multiplataforma que oferece suporte a todas as distribuições Linux padrão suportadas por driver NVIDIA. A ferramenta utilitária de linha de comando é instalada com os drivers NVIDIA e provavelmente é a ferramenta de monitoramento com a qual a maioria dos usuários está familiarizada. Podemos realizar monitoramento ao vivo usando watch e nvidia-smi juntos, por exemplo: $ watch -n0.1 nvidia-smi.

No entanto, o nvidia-smi é bastante básico. Este artigo explora outras ferramentas úteis de monitoramento de GPU da NVIDIA. Abaixo, está alista de ferramenta elencadas pelo site Linux Links, que apresenta 6 delas, para gerenciamento e monitoramento de GPU NVIDIA.

conheca-6-ferramentas-de-monitoramento-de-gpu-nvidia-gratuitas-e-de-codigo-aberto
Imagem: Linux Links

Vamos explorar as ferramentas disponíveis. Para cada aplicativo, colocamos um pequeno resumo.

Ferramentas de monitoramento de GPU NVIDIA

  • nvitop: O nvitop é um dispositivo NVIDIA interativo e uma ferramenta de monitoramento de processos e se autodenomina “a solução completa para gerenciamento de processos de GPU”. Como o nvidia-smi, o nvitop é construído sobre o NVML, mas a ferramenta oferece muito mais funcionalidade. É um software livre e de código aberto escrito em Python;
  • NVTOP: NVTOP (Neat Videocard TOP) é ??um monitor de tarefas tipo (h)top para GPUs AMD, Intel e NVIDIA. Ele pode lidar com várias GPUs e imprimir informações sobre elas de uma maneira muito familiar;
  • gpusta: um utilitário de linha de comando simples para consultar e monitorar o status da GPU;
  • NVDashboard: uma extensão do JupyterLab para exibir painéis de uso de GPU. Ele permite que os usuários do JupyterLab visualizem as métricas de hardware do sistema no mesmo ambiente interativo que usam para desenvolvimento;
  • GreenWithEnvy: Ferramenta do sistema que fornece informações, controla ventiladores e faz overclock de placas NVIDIA. Esta série destaca as ferramentas essenciais do sistema;
  • nvidia-htop: Enriquece a saída de nvidia-smi. Ele imprime a utilização da GPU com nomes de usuários e estatísticas da CPU para cada processo de utilização da GPU.