我经常看到符号“None”、“-1”和“?” 让程序动态定义张量的维度(例如批量大小),看起来效果相同:
x = tf.placeholder(tf.float32, [None, 48, 48, 3], name='InputData')
input = tf.reshape(input, [-1, input_size])
foo("bar", shape=(?,48), dtype=float32)
使用这些符号中的任何一个与另一个有什么功能上的区别吗?
谢谢
最佳答案
我是这样想的:
None
表示未指定维度。因此,例如,如果您定义了一个占位符,则可以使用 None
表示“此维度可以具有任何大小”。
占位符可以有多个 None
维度。这仅仅意味着多个维度可以是不同的大小。甚至整个形状都可以是 None
以指定未知数量的维度。
-1
是 Tensorflow 自行推断维度大小的指令。在 tf.reshape(input, [-1, input_size])
中,这意味着“ reshape 它,使第二个维度是 input_size
,第一个维度是任何需要的以匹配元素的总数。
这并不一定意味着维度未知,因为它是 None
。如果您的输入张量已知大小为 10 个元素,并且您将其整形为 [-1, 2]
,Tensorflow 能够推断出完整的形状 [5, 2]
.
-1
纯粹是为了方便。你总是可以明确地写下形状而不是让 Tensorflow 推断它。另一方面,None
是接受可变大小张量所必需的。
一个形状中只能有一个 -1
。多个没有意义,因为不可能推断出形状。例如。如果张量中有 12 个元素, reshape 为 [-1, -1, 2]
是未定义的——我们应该做 [3, 2, 2]
吗? [2, 3, 2]
? [6, 1, 2]
?...
最后,问号正是 Tensorflow 在打印张量和/或其形状时用来标记“未知”维度的东西。您发布的示例实际上会产生语法错误——您不能自己使用问号。未知维度的原因当然可以是具有 None
维度的占位符,并且通常根据占位符定义的张量(即应用于它们的某些操作的结果)也将具有未知维度。此外,一些操作可能未指定(部分)它们的输出形状,这也可能导致未知数。
我在这里可能遗漏了一些更多的技术细节,但作为一个经验法则:使用 None
作为占位符,使用 -1
来 reshape 。这应该涵盖大多数用例。
关于python - Tensorflow 无,-1 和 之间有什么区别?指定张量形状时?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51732686/