image-processing - 图像上的机器学习:如何预处理数据

标签 image-processing machine-learning classification

几年前,我研究了非常简短的有监督的机器学习和分类,现在,我想用一个真实的用例来介绍一下。

我想将其应用于纹理分类。例如,给定带有不同墙纸的墙壁的带标签的图片,我希望它能够学习对它是哪种墙纸进行分类。

我知道,通常,图像会被分成小块,形成“视觉词汇”,然后我们可以在其上训练算法。

但是我仍然停留在第一步:在应用学习算法之前,我应该如何准备图像?例如,我知道大多数时候学习都是在二进制图像上完成的,但是在我看来,颜色可能是一类的特征。但是二值化可能在墙纸由图案或颗粒纹理识别的情况下有用。在这种情况下,我不知道是否有通用操作可应用于图像以使这些特征更加明显。如果是这种情况,我应该为每个样本创建几张图像吗?

综上所述,我想知道在创建特征矢量之前准备图像的常用方法有哪些,特别是因为我正在使用RGB数据,这可能会使处理过程更加复杂。任何建议将不胜感激

最佳答案

对于每个班级,您都可以剪一些小补丁,并保留颜色信息。大多数DNN库都支持多通道图像。然后,您可以简单地将每个像素值除以255(如果您的图像是8位)并减去0.5,就像每个色块居中(平均0)一样,并且标准偏差小于0.5。

但是要小心,在输出层中每个类需要一个神经元,这会使DNN变得非常大。

关于image-processing - 图像上的机器学习:如何预处理数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36176338/

相关文章:

C++ 创建子矩阵

image-processing - opencl中的共享内存与纹理内存

python - 为什么 KNeighborsClassifier 总是预测相同的数字?

java - 将 mahout 随机森林分类输出转换为可读

machine-learning - scikit learn 离散化分类数值数据

php - Laravel 使用 Ajax 上传多张图片

c++ - 将 QImage 分成更小的部分

python - Keras Multilabel Multiclass 单个标签准确率

machine-learning - 我什么时候应该停止训练我的模型?

machine-learning - 使用 Weka 进行句子分类