tensorflow - tensorflow安装的速度基准测试

标签 tensorflow

我怀疑在我的gpu盒上是否正确配置了tensorflow,因为在花哨的gpu机器上训练一个简单的线性回归模型(batchsize = 32,1500个输入特征,150个输出变量)时,每次迭代的速度大约慢100倍,而在笔记本电脑上。

我正在使用配有现代CPU的Titan X,等等。nvidia-smi说我的gpu利用率仅为10%,但是我希望这是因为批处理量很小。我没有使用feed_dict将数据移动到计算图中。一切都通过tf.decode_csv和tf.train.shuffle_batch来了。

有人对如何轻松测试我的安装是否正确有任何建议吗?有没有简单的速度基准?我的笔记本电脑和gpu机器之间的速度差异如此之大,以至于我期望配置不正确。

最佳答案

尝试tensorflow/tensorflow/models/image/mnist/convolutional.py,它将按步打印时间。

在Tesla K40c上,每步应该获得大约16 ms,而在我使用了3年的旧机器上,仅用于CPU的120 ms
编辑:这已移至models信息库:https://github.com/tensorflow/models/blob/master/tutorials/image/mnist/convolutional.py
convolutional.py文件现在位于models/tutorials/image/mnist/convolutional.py

关于tensorflow - tensorflow安装的速度基准测试,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35703201/

相关文章:

python - 在 TensorflowJS 中构建神经网络

python - 在循环中评估 Tensorflow 操作非常慢

tensorflow - 我应该对所有函数使用 @tf.function 吗?

python - tensorflow 中是否有与list.append()类似的函数?

c++ - 如何使用 Custom OP 在 C++ 中构建 TensorFlow Graph?

tensorflow - 如何编写和检索列表形式的 TFRecord 功能?

python - 使用文件夹结构在 Keras 中进行预测时如何获得正确的标签?

object - 如何在没有 nms 的情况下从 Tensorflow 对象检测 ssd-mobilenet 解码 raw_outputs/box_encodings

python - 出于性能目的对 Tensorflow 中的一批图像进行推理的正确方法是什么

machine-learning - 如何在 Keras 上仅加载特定权重