python - 图像噪声与图像文本匹配

标签 python machine-learning

所以我一直在阅读使用 TensorFlow 和 Keras 的机器学习,我一直在尝试使用一些自定义图像设置数据集,并尝试学习脚本来识别文本,同时过滤掉噪音,但是问题是噪声颜色和文本颜色相同,导致过滤掉所有内容。

我并不是要求填鸭式的,我只是想要指出解决/训练脚本来解决图像上的文本的最佳方法。

我正在寻找的是让脚本在屏幕上读取并计算隐藏在图像中的单词并在命令行中打印结果。

没有示例代码,因为之前的一切都是失败的,而不是我真正想要的。

Album link for Imgur

最佳答案

在开始项目之前,您应该检查数据的“质量”,它对于实时应用程序或您的项目来说是有值(value)的,如果图像不容易被人类读取,那么就有点错误了使用此类数据进行训练,因为人类往往非常擅长视觉识别事物,并且很多时候“偏差错误”取决于此。
无论如何,如果您旨在从图像中读取嘈杂的文本,您可以尝试以下技巧,这些技巧取自 coursera 上的在线类(class),名为:“改进深度神经网络:超参数调整、正则化和优化” 作者:Andrew Ng 教授:

1 - 在正常和清晰的文本图像上训练数据,因为 会让你的算法从清晰的图像中学习很多特征和初始属性,例如字母的形状,有时你可能会对结果感到惊讶。

2 - 让您的DEV集(和您的测试集)包含大量嘈杂的文本图像,以便您可以检查您的算法在您真正关心的数据上的实际表现(您的目标)

3 - 更改数据集可能有点困难,但如果噪声以一种即使对于人类来说也难以阅读的方式成为照片的一部分,则该数据集可能毫无用处。(并非总是如此) 因此,您可以带来噪声清晰的图像,并将它们与噪声图像混合(从旧数据集创建一个新数据集),使其保持现实且没有太多机器人,然后根据新数据训练算法。

构建良好的机器学习算法或应用程序首先取决于您的数据,这些只是一些符号,可以帮助您以另一种方式思考问题。

关于python - 图像噪声与图像文本匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59462922/

相关文章:

python - Pandas Dataframe Groupby 多列

python - 根据python中的条件将子列表单独分组在列表中

python - 对两个向量使用 np.dot 有何效果?

python - 二元分类器总是返回 0.5

r - 当 classProbs=TRUE 时,在 R 中使用 Caret 的 SVM 的不同结果

python OpenAI健身房监视器在录制目录中创建json文件

python - AttributeError: 'builtin_function_or_method' 对象没有属性 'split'

python - 显示半小时间隔的数据框列

python - GridSearchCV 是否执行交叉验证?

python - ValueError : Unable to coerce to Series, 长度必须为 1:给定 n