python - Tensorflow body 部位识别

关闭。这个问题需要多问focused 。目前不接受答案。

想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post .

已关闭 4 年前。

Improve this question

我是一名对 ML 和使用 Tensorflow 非常感兴趣的开发人员，但尽管我已经完成了所有教程，但我真的很难开始构建自己的模型，并希望你们能帮助回答一些可能很漂亮的问题简单。

我正在尝试构建一种算法，可以从图像中检测 body 上的特定点(肩膀、手腕等)，但是我不确定模型的输出应该是什么，我的训练数据是一组图像和点的 x,y 值列表，我希望返回图像上点位置的预测(类似于面部识别)。

但是我在构建这个时有几个问题:

1- 我的应用程序的输出应该是什么？我希望算法返回每个点最有可能的 x,y 位置，但不确定如何在 tensorflow 中表示它，我是否需要在每个像素的输出中使用大量张量，并且正确的像素值为 1？

2-我如何处理不同尺寸的图像，因为输入张量将具有预定数量的特征，我的算法如何接受任何尺寸的图像？

3- 如何判断图像上是否没有有效点？是否只是在我的训练集中包含空图像？

我希望这些问题有意义，我感谢那些花时间阅读它的人!这对我理解 Tensorflow 以及在追求 ML 兴趣方面取得良好进展有很大帮助!

最佳答案

这可以通过各种不同的方式来完成，具体取决于您想要如何编码数据的语义。我尝试举一个非常简单的例子，但可能不会有最好的结果:

1 - 您可以将人体姿势表示为顶点列表，它是一个向量。例如，这可能是:

[left_shoulder,
 right_shoulder,
 torso,
 ...]

每个顶点都是一个 x, y 元组，因此您的输出尺寸将为 [vertex_count, 2] 或 vertex_count * 2(扁平版本)。因此，输出将是每个顶点的 x,y 位置。这是一个回归问题，因为您的输出尝试 generate continuous values 。您还可以添加已识别 body 姿势的置信度值。这样做的优点是，如果没有识别到姿势，则能够不显示/处理姿势，并且在解释模型的输出时可以使用简单的截止。

2 - 处理不同尺寸图像的最简单方法是添加预处理步骤:只需调整图像大小以适合您训练的模型。

3 - 是的，这可能是一个很好的起点。也许还有那些不适合框架的 body ，很难标记。

@EighteenthVariable 在 Medium 上分享的文章也是一个很好的开始，可以帮助您更好地理解。

关于python - Tensorflow body 部位识别，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52906028/

python - Tensorflow body 部位识别

上一篇：python - 根据元素拆分 Numpy 数组，其中数组的每个元素都是唯一的

下一篇：python - OneHotEncoder 对属于同一类别的多个列进行处理