本文介绍了 2 种在 Linux 上监控 Nvidia 显卡的工具:一种带有终端用户界面 (TUI),因此它在控制台中运行,另一种使用图形用户界面。
这些用于监控 Nvidia GPU 的实用程序需要使用专有的 Nvidia 图形驱动程序。
nvtop – 用于监控 Nvidia GPU 的终端用户界面
nvtop 是一个类似于 (h)top 的 Nvidia GPU 任务监视器。 它使用 ncurses 在终端中绘制基于文本的用户界面,并使用 NVIDIA 管理库 (NVML) 获取 GPU 信息。
由于它使用 NVML,此命令行工具不支持较旧的 Nvidia GPU。 GeForce 600、GeForce 800M 和更新的应该可以工作,但不支持较旧的 GPU。
nvtop 特点:
- 支持多个 GPU
- 显示在 Nvidia GPU 上运行的进程列表、它们的名称、pid、它们对 GPU、内存和 CPU 的使用率等。这些进程可以从 nvtop 中排序和终止
- 显示 GPU 和内存利用率的图表
- 显示当前(实时)GPU 和内存利用率以及频率、风扇速度、电源使用情况和温度
nvtop 最近被添加到 Ubuntu 19.04+ 和 Debian buster 和 sid (contrib) 存储库中。 但是,如果您想将它与不在存储库中的驱动程序一起使用(例如,如果您使用较新的驱动程序),它将无法安装,因为它取决于存储库中的特定驱动程序版本。 在这种情况下,从源代码安装它,这很容易。
nvtop README 包含从源代码(包括所需的依赖项)为 Debian / Ubuntu 构建工具的说明, Fedora /RedHat/CentOS、openSUSE 和 Arch Linux。
适用于 Linux 的 Nvidia 系统监视器 GUI
Nvidia System Monitor Qt 是一个新的图形工具,用于查看 GPU 上运行的进程列表,并监控 Nvidia 显卡的 GPU 和内存利用率(使用图形)。 它利用 nvidia-smi 工具来获取 GPU 信息。
这个用于 Linux 的 Nvidia 任务管理器只有 12 天,所以它仍然需要一些工作。 开发人员表示,其他功能,例如监控 Nvidia GPU 温度的能力,使程序以其他语言可用等,将在下一个版本中添加。
英伟达系统监视器功能:
- 进程:显示在 GPU 上运行的进程列表,包括进程名称、pid、已用内存等
- 用途:
- GPU:显示 GPU 利用率图表,同时还显示平均、最小和最大 GPU 利用率
- 内存:显示 Nvidia GPU 内存利用率,同时还显示平均、最小和最大内存利用率。 您还可以在此处查看 GPU 总内存、可用内存和已用内存。
默认情况下,Nvidia 系统监视器每 2 秒(2000 毫秒)更新一次。 如果要更改此设置,请创建一个名为config
在里面~/.config/nvidia-system-monitor
文件夹,并添加updateDelay
后跟此文件的时间(以毫秒为单位)。 例如,使用updateDelay 500
让 NVIDIA 系统监视器每 500 毫秒(0.5 秒)更新一次。
要安装 NVIDIA System Monitor,您需要安装其构建依赖项。 同时安装 Git 以从 Git 获取应用程序的最新代码 在 Debian、Ubuntu 或 Linux Mint 中,使用以下命令安装这些软件包:
sudo apt install git qtdeclarative5-dev cmake