image-processing - 图像上的机器学习:如何预处理数据

标签 image-processing machine-learning classification

几年前，我研究了非常简短的有监督的机器学习和分类，现在，我想用一个真实的用例来介绍一下。

我想将其应用于纹理分类。例如，给定带有不同墙纸的墙壁的带标签的图片，我希望它能够学习对它是哪种墙纸进行分类。

我知道，通常，图像会被分成小块，形成“视觉词汇”，然后我们可以在其上训练算法。

但是我仍然停留在第一步：在应用学习算法之前，我应该如何准备图像？例如，我知道大多数时候学习都是在二进制图像上完成的，但是在我看来，颜色可能是一类的特征。但是二值化可能在墙纸由图案或颗粒纹理识别的情况下有用。在这种情况下，我不知道是否有通用操作可应用于图像以使这些特征更加明显。如果是这种情况，我应该为每个样本创建几张图像吗？

综上所述，我想知道在创建特征矢量之前准备图像的常用方法有哪些，特别是因为我正在使用RGB数据，这可能会使处理过程更加复杂。任何建议将不胜感激

最佳答案

对于每个班级，您都可以剪一些小补丁，并保留颜色信息。大多数DNN库都支持多通道图像。然后，您可以简单地将每个像素值除以255（如果您的图像是8位）并减去0.5，就像每个色块居中（平均0）一样，并且标准偏差小于0.5。

但是要小心，在输出层中每个类需要一个神经元，这会使DNN变得非常大。

关于image-processing - 图像上的机器学习:如何预处理数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36176338/

上一篇：python - 将预训练的咖啡模型加载到烤宽面条中？

下一篇：python-2.7 - 有人可以解释我在使用 Python 构建机器学习系统运行文件 blei_lda.py 时遇到的不受支持的操作数错误吗？

相关文章：

C++ 创建子矩阵

image-processing - opencl中的共享内存与纹理内存

python - 为什么 KNeighborsClassifier 总是预测相同的数字？

java - 将 mahout 随机森林分类输出转换为可读

machine-learning - scikit learn 离散化分类数值数据

php - Laravel 使用 Ajax 上传多张图片

c++ - 将 QImage 分成更小的部分

python - Keras Multilabel Multiclass 单个标签准确率

machine-learning - 我什么时候应该停止训练我的模型？

machine-learning - 使用 Weka 进行句子分类