在阅读论文:“未知工作空间中基于触觉的主动对象识别和目标对象搜索”时,有一些我无法理解的内容:
这篇论文是关于仅使用触觉信息来查找对象的位置和其他属性。在第 4.1.2 节中,作者说他使用 GPR 来指导探索过程,并在第 4.1.4 节中描述了他如何训练 GPR:
- 使用 4.1.2 节中的示例,输入为 (x,z),输出为 y。
- 只要有联系人,就会存储相应的 y 值。
- 此过程会重复多次。
- 经过训练的 GPR 用于估计下一个探索点,即方差最大的点。
在以下链接中,您还可以看到演示:https://www.youtube.com/watch?v=ZiLq3i-BJcA&t=177s 。在视频的第一部分 (0:24-0:29) 中,第一次初始化发生在机器人采样 4 次的地方。然后在接下来的25秒内,机器人会从相应的方向进行探索。我不明白探地雷达的微小初始化如何指导探索过程。有人可以解释一下如何估计第一个探索部分的输入点 (x,z) 吗?
最佳答案
任何回归算法都只是以特定算法特有的某种方式将输入(x,z)
映射到输出y
。对于新输入(x0,z0)
,如果训练中包含许多与此类似的数据点,算法可能会预测非常接近真实输出y0
的结果。如果仅在完全不同的区域提供训练数据,则预测可能会非常糟糕。
GPR 包括预测置信度的度量,即方差。在之前没有见过训练数据的区域中,方差自然会非常高,而在非常接近已经见过的数据点的区域中,方差自然会非常高。如果“实验”花费的时间比评估高斯过程的时间长得多,您可以使用高斯过程拟合来确保对答案非常不确定的区域进行采样。
如果目标是充分探索整个输入空间,您可以绘制许多 (x,z)
随机值并评估这些值的方差。然后,您可以在 y
中最不确定的输入点执行成本高昂的实验。然后,您可以使用迄今为止探索的所有数据重新训练探地雷达并重复该过程。
对于优化问题(不是OP的问题)
如果您希望在输入空间中找到 y
的最低值,则您不会对在已知具有较高 y
值的区域中进行实验感兴趣,但您只是不确定这些值会有多高。因此,您可以选择 y
的预测值加上一个标准差,而不是选择方差最高的 (x,z)
点。这种最小化值的方式称为贝叶斯优化,这种特定方案称为置信上限 (UCB)。预期改进 (EI) - 提高先前最佳分数的概率 - 也很常用。
关于machine-learning - 高斯进度回归用例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59868933/