machine-learning - 需要有关实时视频上的对象检测和运动分类的建议

标签 machine-learning computer-vision artificial-intelligence object-detection yolo

我正在研究我的期末项目,我想像 amazon go 一样进行对象检测和运动分类,我已经阅读了很多研究,例如使用 SSD 或 YOLO 进行对象检测以及使用 CNN+LSTM 进行视频分类,我想要提出这样的训练算法:

  1. 使用 SSD/YOLO 实时检测多个对象(在我的例子中:人)
  2. 获取边界对象并裁剪框架
  3. 将裁剪后的帧信息输入 CNN+LSTM 算法以进行运动预测(如果人正在行走/拿取元素)

可以在实时环境下制作吗? 或者有没有更好的实时检测和运动分类的方法

最佳答案

如果你想在实时应用中使用它,还必须考虑其他一些在实际环境中实现算法之前不会出现的事情。

关于您提出的三步方法,它已经可以产生一个好的方法,但第一步会非常准确。我认为最好将这 3 个步骤合并为一个步骤。因为人的运动类型是一个人的良好特征。正因为如此,我认为所有步骤都可以集中在一个步骤中。

我的想法是这样的: 1. 一个视频分类数据集,仅标记人或物体的运动 2.基于cnn-lstm的视频分类方法

这将正确解决您的项目。

这个答案需要更多细节,如果你有兴趣,我可以更详细地回答你。

关于machine-learning - 需要有关实时视频上的对象检测和运动分类的建议,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58361711/

相关文章:

functional-programming - 当今 AI 研究中使用了哪些语言?

artificial-intelligence - 有没有办法在 Rider 中激活 Code Prediction AI?

python - 回归中的序数分类数据

java - jep 在 java 中使用 scikit 模型

opencv - Facebook 个人资料图片中有多少人?

android - Marker Recognition on Android(识别魔方)

python - 为什么 tensorflow reshape 数组超出范围

python - 我的 CNN 总是得出 0 或 1,而不是百分比。为什么?

machine-learning - tensorflow 形状不正确

java - HOG描述符的实现