opencv - OCR:小文本分割

标签 opencv image-processing language-agnostic ocr image-segmentation

问题

我一直在构建一个(非常)简单的 OCR 引擎。由于我正在尝试对非常小(像素大小)的字符进行分类，因此我在分割方面遇到了一些困难。这是一个示例，在尽力而为的图像范围阈值处理之后:

image of problematic segmentation on 63 :

我尝试过的

错误检测:

段的水平尺寸较大。它主要有效，但失败(误报) 对于一些较大的字符。
分类，并在低分时拒绝。这似乎有点浪费。

错误更正:

垂直添加像素(垂直直方图)，找到最小值。在许多样本中，它在错误的地方切割了很多片段。

我还没有尝试过的

尝试对所有可能的分割点(像素)进行分类。这将非常浪费，并且难以扩展为 3 个合并字符的段。
我一直在阅读 morphology approaches将字符变成数学曲线，但我真的不知道从哪里开始，或者是否值得努力

从这里去哪里？

我不知道。因此这个问题:)

最佳答案

body 向后靠，半闭上眼睛。

63:-)

现在，要是计算机能这么简单就好了!

它非常接近双图案在硅掩模中的作用(或未作用？)。

我会建议过采样(每个轴上的像素数加倍或四倍)、过滤(可能是低通 - 或者可能是带通，其中通带 = 一条线的空间频率)、重新设定阈值直到它们分开。价格昂贵，所以只适用于有问题的地方。

关于opencv - OCR:小文本分割，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14000092/

上一篇：python - 没有名为 cv 的模块

下一篇：image - 如何实现类似photoshop的 "patch tool"功能？

相关文章：

c++ - 有没有办法防止opencv矩阵除法中的舍入

python - 在 OpenCV Python 中从图像中减去渐晕模板

python - 将来自相机的帧写入 OpenCV 中的单个图像

c++ - 使用 Qt 显示来自 OpenCV 的网络摄像头流

javascript - Chrome 未按预期呈现 Canvas 数据 [JS/Canvas API]

python - 计算连续 "stream"图像中颜色变化的索引

python - 在图像中发现不完全相同的模板

algorithm - 伪随机数生成器 - 指数分布

language-agnostic - 识别图像时的神经网络决策过程有可视化吗？

c# - 帮助命名一个类，该类具有一个名为 Execute() 的公共(public)方法

©2024 IT工具网联系我们