我有来自 的图像补丁DDSM 乳房 X 光检查 是150x150
在尺寸方面。我想通过将这些图像随机裁剪 2 次到 120x120
来扩充我的数据集尺寸。所以,如果我的数据集包含 6500
图像,用随机裁剪增加它应该让我到 13000
图片。问题是,我不想丢失图像中的潜在信息并可能更改地面实况标签。
最好的方法是什么?我应该从 150x150
随机裁剪它们吗?至120x120
并希望获得最好的结果,或者可能先填充它们然后再进行裁剪?解决这个问题的标准方法是什么?
最佳答案
如果您的地面实况包含您要分类的确切位置,请使用地面实况以明智的方式裁剪图像。 IE。如果您要删除要分类的内容,请调整基本事实。
如果您不知道要分类的位置,您可以
但是你如何“找出你的分类器对哪些区域使用react”?
Visualizing and Understanding Convolutional Networks 中描述了多种方法。泽勒和弗格斯:
想象一下,您的分类器对乳腺癌或无乳腺癌进行分类。现在只需拍摄一张包含乳腺癌阳性信息的图像,并用一些空白颜色遮挡图像的一部分(参见上图中的灰色方 block ,Zeiler 等人的图像)并预测癌症与否。现在移动被遮挡的正方形。最后,您将获得原始图像所有部分的粗略预测分数(请参见上图中的(d)),因为当您掩盖了负责积极预测的重要部分时,您(应该)得到一个阴性癌症预测。
如果您的某人实际上可以在图像中识别癌症,这也是检查和防范混淆因素的好方法。
顺便说一句:您可能希望即时裁剪并随机化裁剪方式以生成更多样本。
如果 150x150 已经是 region of interest (ROI)您可以尝试以下数据扩充:
关于opencv - 深度学习 - 如何执行 RANDOM CROP 并且不丢失数据中的任何信息(更改地面实况标签),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62738868/