我拼命地试图理解 taps 的论点
在 theano.scan 函数中。不幸的是我
无法提出具体问题。
我只是不明白“点击”机制。
嗯,我还好。我知道序列的顺序
传递给函数,但我不知道
意义。例如(我从
另一个问题 Python - Theano scan() function ):
import numpy as np
import theano
import theano.tensor as T
def addf(a1,a2):
print(a1)
print(a2)
return a1+a2
i = T.iscalar('i')
x0 = T.ivector('x0')
step= T.iscalar('step')
results, updates = theano.scan(fn=addf,
outputs_info=[dict(initial=x0, taps=[-3])],
non_sequences=step,
n_steps=i)
f=theano.function([x0, step,i],results)
input = [2, 3]
print(f(input, 2, 20))
将水龙头设置为 -1 对我来说确实有意义。据我所理解
这与不设置抽头值和整个向量“x0”相同
正在传递给 addf 函数。然后将添加 x0
使用“step”参数(int 2 将广播到相同的大小)。
在下一次迭代中,结果 [4, 5] 将作为输入,依此类推
产生以下输出:
[[ 4 5]
[ 6 7]
[ 8 9]
[10 11]
[12 13]
[14 15]
[16 17]
[18 19]
[20 21]
[22 23]
[24 25]
[26 27]
[28 29]
[30 31]
[32 33]
[34 35]
[36 37]
[38 39]
[40 41]
[42 43]]
然而,将 taps 设置为 -3 会产生以下输出:
[ 5 2 6 7 4 8 9 6 10 11 8 12 13 10 14 15 12 16 17]
我没有任何解释扫描功能如何创建这个
输出。为什么现在只是一个列表?
“打印(a1)”结果如预期的那样
x0[t-3]
虽然我知道这是a1应该有的值,
我不知道如何解释它。 t-3 th 值是多少
x0?
Theano 文档
似乎并没有详细介绍 taps 参数......
所以希望你们中的一个会是。
谢谢
最佳答案
为了更好地理解 taps
的使用,你应该先了解如何scan
使用 outputs_info
参数以及为它提供的值(准确地说是 initial
)如何改变结果的性质。scan
期望你提供你期望从这个操作中得到的输出类型(除非你没有提供任何初始值并简单地提到 None
,在这种情况下它将开始第一轮 { step
} 并且输出是在连续几轮中没有作为参数传递给 fn
)。
所以scan
用于对提供的 sequences
进行迭代归约.这意味着在 step
n (并且没有为 taps
或 sequences
指定 outputs_info
),给定的 fn
将应用于每个 sequences
的第 n 个元素以及前一个(第 n-1 个)生成的输出 step
.因此默认值为 taps
为 sequences
是 0
和 outputs_info
是 -1
.
另一种看待它的方法是考虑所有序列都由它们各自的第一维上的切片组成。因此,对于特定步骤,sequence(s)
的当前切片并将上一步的输出切片传递给 fn
并将计算出的输出作为新切片添加到结果中,然后将用于下一个 step
.很明显,每个输出切片都具有相同的形状。如果您提供初始切片作为 outputs_info
的一部分那么它也应该具有与fn
的应用程序产生的相同的形状。 .在您的示例中,如果 output_info=[dict(initial=x0)]
,需要 [2, 3]
作为第一个切片并将其用于第一个 step
作为参数 a1
至 addf
.
但通常在信号处理(和其他地方)中,您需要的不仅仅是最后的数据点作为因果信息。这里我用时间来表示steps
.无论如何,这里是taps
很有用,有助于准确指示来自 sequences
的数据点和 results
必须用于当前 step
.在您的示例中,这意味着对于当前 step
倒数第三个输出应传递给 fn
.
这就是您在描述 initial
时需要小心的地方。为 outputs_info
.因为扫描会先拆分initial
沿第一个维度将值分成多个切片。 那么这组切片中的第一个切片将被认为是最早的切片 (在您的示例中倒数第三)需要计算第一个 step
的输出 .
让我们假设在你的例子中,taps=[-2]
和 input = [2, 3]
.在这种情况下, scan 会将输入拆分为多个切片并使用第一个切片(此处为值 2)作为参数 a1
至 addf
.结果值 4 将添加到输出中,对于下一步,切片将包括 [2, 3, 4],其中值 3 位于倒数第二个 (-2) 抽头上。等等。但是,与 taps=[-3]
和相同的 input
,缺少一个值,这就像说您在时间 (t-3) 和 (t-2) 处收集了值,但没有在 (t-1) 处收集值。
因此,如果您认为您的输出具有某种形状,并且您需要多次抽头输出超过 -1,则 initial
的值应该是所需输出形状的元素列表 和 有 正好检索最早的切片所需的尽可能多的此类元素。
域名注册地址:
在您的示例中,如果您想获得每个 step
的结果的二维向量并且正在使用 taps=[-3]
,然后 input
应该是 3 个这样的二维向量的列表。如果您想获得单值结果,则 input
应该是一个包含 3 个整数的列表。包含 2 个整数的列表在这种情况下根本没有意义。只有 taps
才有意义是 -2 或 -1 或 [-2, -1]
.
关于Python theano.scan taps 参数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29993665/