他们简单地通过结合 CNN 和 RNN 构建了一个 CRNN 网络,以制作一个视频分类器来区分足球比赛和电视广告。
我的问题是分类或简单地确定该输入视频是否包含作弊行为(考试作弊),因此根据本教程,我应该通过一组作弊和非作弊图像来训练 CNN,然后我会通过一系列帧通过该网络输出一系列(作弊者/非作弊者)标志,最后用该输出训练或测试 RNN。
在这种情况下,CNN 会表现良好吗?因为我会用我自己和我的团队充当作弊者和非作弊者,以获得大量数据集来训练 CNN,这意味着同一个人会充当作弊者和非作弊者。非作弊者,这可能会导致困惑!
我的最后一个问题是我可以使用教程中声明的方法进行行为分类吗? .. 或者 CNN 能否成功区分作弊帧和非作弊帧?
最佳答案
实际上,使用相同的人来制作作弊者和非作弊者剪辑将改善训练。神经网络必须学会通过 Action 来区分作弊者,而不是通过 body 特征。
我希望这对您来说效果相当好。但是,根据特定行为,您可能需要使用视频序列而不是单个帧来描述某些行为。有时,作弊行为由一系列请求和响应组成,而不是单个帧中包含的数据。
这有帮助吗?
关于machine-learning - 用于行为分类的 CNN,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42404697/