2 个在 Linux 上监控 Nvidia GPU 的工具(GUI 和命令行)

本文介绍了 2 种在 Linux 上监控 Nvidia 显卡的工具:一种带有终端用户界面 (TUI),因此它在控制台中运行,另一种使用图形用户界面。

这些用于监控 Nvidia GPU 的实用程序需要使用专有的 Nvidia 图形驱动程序。

nvtop – 用于监控 Nvidia GPU 的终端用户界面

nvtop 是一个类似于 (h)top 的 Nvidia GPU 任务监视器。 它使用 ncurses 在终端中绘制基于文本的用户界面,并使用 NVIDIA 管理库 (NVML) 获取 GPU 信息。

由于它使用 NVML,此命令行工具不支持较旧的 Nvidia GPU。 GeForce 600、GeForce 800M 和更新的应该可以工作,但不支持较旧的 GPU。

nvtop 特点:

  • 支持多个 GPU
  • 显示在 Nvidia GPU 上运行的进程列表、它们的名称、pid、它们对 GPU、内存和 CPU 的使用率等。这些进程可以从 nvtop 中排序和终止
  • 显示 GPU 和内存利用率的图表
  • 显示当前(实时)GPU 和内存利用率以及频率、风扇速度、电源使用情况和温度

nvtop 最近被添加到 Ubuntu 19.04+ 和 Debian buster 和 sid (contrib) 存储库中。 但是,如果您想将它与不在存储库中的驱动程序一起使用(例如,如果您使用较新的驱动程序),它将无法安装,因为它取决于存储库中的特定驱动程序版本。 在这种情况下,从源代码安装它,这很容易。

nvtop README 包含从源代码(包括所需的依赖项)为 Debian / Ubuntu 构建工具的说明, Fedora /RedHat/CentOS、openSUSE 和 Arch Linux。

适用于 Linux 的 Nvidia 系统监视器 GUI

Nvidia System Monitor Qt 是一个新的图形工具,用于查看 GPU 上运行的进程列表,并监控 Nvidia 显卡的 GPU 和内存利用率(使用图形)。 它利用 nvidia-smi 工具来获取 GPU 信息。

这个用于 Linux 的 Nvidia 任务管理器只有 12 天,所以它仍然需要一些工作。 开发人员表示,其他功能,例如监控 Nvidia GPU 温度的能力,使程序以其他语言可用等,将在下一个版本中添加。

英伟达系统监视器功能:

  • 进程:显示在 GPU 上运行的进程列表,包括进程名称、pid、已用内存等
  • 用途:
    • GPU:显示 GPU 利用率图表,同时还显示平均、最小和最大 GPU 利用率
    • 内存:显示 Nvidia GPU 内存利用率,同时还显示平均、最小和最大内存利用率。 您还可以在此处查看 GPU 总内存、可用内存和已用内存。

默认情况下,Nvidia 系统监视器每 2 秒(2000 毫秒)更新一次。 如果要更改此设置,请创建一个名为
config

在里面
~/.config/nvidia-system-monitor

文件夹,并添加
updateDelay

后跟此文件的时间(以毫秒为单位)。 例如,使用
updateDelay 500

让 NVIDIA 系统监视器每 500 毫秒(0.5 秒)更新一次。

要安装 NVIDIA System Monitor,您需要安装其构建依赖项。 同时安装 Git 以从 Git 获取应用程序的最新代码 在 Debian、Ubuntu 或 Linux Mint 中,使用以下命令安装这些软件包:

sudo apt install git qtdeclarative5-dev cmake