我使用来自tensorflow_hub的预训练resnet50成功训练了一个用于单个图像分类的CNN。
现在我的目标是向我的网络提供按时间顺序排列的图像序列(不是视频)作为输入,以对主体的行为进行分类。 每个序列由每 100 毫秒拍摄的 20 张图像组成。
最好的神经网络是什么?在哪里可以找到与我类似的问题的文档/示例?
最佳答案
只要有顺序数据,某种类型的循环神经网络就是一个很好的选择(通常是 LSTM 的形式)。
您的模型可能看起来像 CNN-LSTM 的组合,因为您的图片具有某种顺序关系。
Here is a link to some examples and tutorials 。他将在他的示例中设置一个 CNN,但您可能可以调整您的架构以使用您已经制作的 resNet。尽管您处理的不是视频,但您的问题共享相同的域。
Here是一篇使用神经网络架构(如上面描述的架构)的论文,您可能会觉得有用。
关于tensorflow - 图像序列的分类(固定数量),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59953798/