tensorflow - 内存使用指标 `nvidia-smi dmon` 与 `nvidia-smi` 之间有何差异

标签 tensorflow nvidia

我得到nvidia-smi得到Memory-Usage是这样的

$nvidia-smi -i 0,1
Wed Mar  4 16:20:07 2020       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 418.113      Driver Version: 418.113      CUDA Version: 10.1     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce RTX 208...  Off  | 00000000:18:00.0 Off |                  N/A |
| 27%   37C    P8     1W / 250W |  10789MiB / 10989MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   1  GeForce RTX 208...  Off  | 00000000:3B:00.0 Off |                  N/A |
| 41%   50C    P2    67W / 250W |  10893MiB / 10989MiB |      2%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0    231853      C   tensorflow_model_server                    10779MiB |
|    1    120908      C   python                                     10883MiB |
+-----------------------------------------------------------------------------+

这个内存使用率是99%,但是 当我得到像这样的 nvidia-smi dmon

$nvidia-smi dmon -i 0,1
# gpu   pwr gtemp mtemp    sm   mem   enc   dec  mclk  pclk
# Idx     W     C     C     %     %     %     %   MHz   MHz
    0     1    37     -     0     0     0     0   405   300
    1    67    50     -     0     0     0     0  6800  1350
    0     1    37     -     0     0     0     0   405   300
    1    67    50     -     0     0     0     0  6800  1350
    0     1    37     -     0     0     0     0   405   300
    1    67    50     -     0     0     0     0  6800  1350

这个mem%有0%,有时是0~3%。

为什么会有这样的差异?

最佳答案

Memory-Usage来自nvidia-smi是内存的使用

mem%来自nvidia-smi dmon是内存的利用率

Memory-Usage = used memory / total memory.

Utilization = time over the past sample period / global (device) memory was being read or written * 100%

关于tensorflow - 内存使用指标 `nvidia-smi dmon` 与 `nvidia-smi` 之间有何差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60521808/

相关文章:

python - 训练损失减少,开发损失增加

Ubuntu kworker 线程消耗 100% CPU

python - Tensorflow,其中(索引) 'and' 条件

python - 用于 TensorFlow 的 SSIM/MS-SSIM

python - 创建临时 keras session ?

compilation - NVIDIA CUDA SDK示例编译不支持的体系结构 'compute_20'

windows - 使用 Nvidia 显卡安装 AMD OpenCL CPU 驱动程序

c++ - CUDA 扭曲和每个 block 的最佳线程数

c++ - Direct3D 和 DXGI 之间的区别

tensorflow - GPU tensorflow 安装问题