几年前,我研究了非常简短的有监督的机器学习和分类,现在,我想用一个真实的用例来介绍一下。
我想将其应用于纹理分类。例如,给定带有不同墙纸的墙壁的带标签的图片,我希望它能够学习对它是哪种墙纸进行分类。
我知道,通常,图像会被分成小块,形成“视觉词汇”,然后我们可以在其上训练算法。
但是我仍然停留在第一步:在应用学习算法之前,我应该如何准备图像?例如,我知道大多数时候学习都是在二进制图像上完成的,但是在我看来,颜色可能是一类的特征。但是二值化可能在墙纸由图案或颗粒纹理识别的情况下有用。在这种情况下,我不知道是否有通用操作可应用于图像以使这些特征更加明显。如果是这种情况,我应该为每个样本创建几张图像吗?
综上所述,我想知道在创建特征矢量之前准备图像的常用方法有哪些,特别是因为我正在使用RGB数据,这可能会使处理过程更加复杂。任何建议将不胜感激
最佳答案
对于每个班级,您都可以剪一些小补丁,并保留颜色信息。大多数DNN库都支持多通道图像。然后,您可以简单地将每个像素值除以255(如果您的图像是8位)并减去0.5,就像每个色块居中(平均0)一样,并且标准偏差小于0.5。
但是要小心,在输出层中每个类需要一个神经元,这会使DNN变得非常大。
关于image-processing - 图像上的机器学习:如何预处理数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36176338/