python - Tensorflow body 部位识别

标签 python tensorflow

我是一名对 ML 和使用 Tensorflow 非常感兴趣的开发人员,但尽管我已经完成了所有教程,但我真的很难开始构建自己的模型,并希望你们能帮助回答一些可能很漂亮的问题简单。

我正在尝试构建一种算法,可以从图像中检测 body 上的特定点(肩膀、手腕等),但是我不确定模型的输出应该是什么,我的训练数据是一组图像和点的 x,y 值列表,我希望返回图像上点位置的预测(类似于面部识别)。

但是我在构建这个时有几个问题:

1- 我的应用程序的输出应该是什么?我希望算法返回每个点最有可能的 x,y 位置,但不确定如何在 tensorflow 中表示它,我是否需要在每个像素的输出中使用大量张量,并且正确的像素值为 1?

2-我如何处理不同尺寸的图像,因为输入张量将具有预定数量的特征,我的算法如何接受任何尺寸的图像?

3- 如何判断图像上是否没有有效点?是否只是在我的训练集中包含空图像?

我希望这些问题有意义,我感谢那些花时间阅读它的人!这对我理解 Tensorflow 以及在追求 ML 兴趣方面取得良好进展有很大帮助!

最佳答案

这可以通过各种不同的方式来完成,具体取决于您想要如何编码数据的语义。我尝试举一个非常简单的例子,但可能不会有最好的结果:

1 - 您可以将人体姿势表示为顶点列表,它是一个向量。例如,这可能是:

[left_shoulder,
 right_shoulder,
 torso,
 ...]

每个顶点都是一个 x, y 元组,因此您的输出尺寸将为 [vertex_count, 2]vertex_count * 2(扁平版本)。因此,输出将是每个顶点的 x,y 位置。这是一个回归问题,因为您的输出尝试 generate continuous values 。您还可以添加已识别 body 姿势的置信度值。这样做的优点是,如果没有识别到​​姿势,则能够不显示/处理姿势,并且在解释模型的输出时可以使用简单的截止。

2 - 处理不同尺寸图像的最简单方法是添加预处理步骤:只需调整图像大小以适合您训练的模型。

3 - 是的,这可能是一个很好的起点。也许还有那些不适合框架的 body ,很难标记。

@EighteenthVariable 在 Medium 上分享的文章也是一个很好的开始,可以帮助您更好地理解。

关于python - Tensorflow body 部位识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52906028/

相关文章:

python - 如何使用python批量向mysql插入数据

Python等待输入的最有效方法是什么

python - 根据新数据点更新预先训练的深度学习模型

tensorflow - 关于机器学习,什么是 "valency"?

python - 如何使用 Python 中的 Discord 机器人获取用户输入?

python - Django 查找图中两个顶点之间的路径

performance - 为什么这个深度学习模型在 CPU 上的推理速度比 GPU 更快?

python - 从 Tensorflow 中的自定义图像数据集创建批处理

python - 如何使用预训练的神经网络处理灰度图像?

c++ - 在 cmake 中启用 gpu 时为 tensorflow 编译静态库 c++ 时出错