machine-learning - 强化学习文献中的 "soft"是什么意思?

标签 machine-learning deep-learning artificial-intelligence reinforcement-learning

我注意到有些论文提到了软代理,我认为这只是一个将熵包含在策略网络的目标函数中的代理。但现在我不再确定了..任何人都可以确认或提供其他解释吗?

最佳答案

所以,看起来确实是这样。 ai.stackexchange上被问到熵从哪里进入SAC并为感兴趣的人提供了很好的答案。

关于machine-learning - 强化学习文献中的 "soft"是什么意思?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59071022/

相关文章:

python - Tensorflow 对象检测 API 训练和导出图

python - 在 Windows 上使用命令 "sudo apt-get install openblas-dev"?

java - 2D 路径点寻路 : combinations of WPs to go from curLocation to targetLocation

image-processing - 使用卷积神经网络进行像素级分类?

algorithm - 将工作与申请人匹配

image-processing - 词袋模型中的分割

python-3.x - Keras 模型适合 ValueError 预期 input_1 比我的数组大小大一个数字

machine-learning - 遗传算法是无监督学习的一种形式吗?

algorithm - SVM - 硬边距还是软边距?

machine-learning - lstm(256) + lstm(256) 和 lstm(512) 有什么区别?