C++:调整 Tesseract 以去除噪声元素

标签 c++ opencv tesseract

我正在尝试对图像进行一些预处理,以从中获取一些文本,但不幸的是,图像上仍然存在一些“嘈杂”元素,它们会损害 OCR。

处理后的图像:

Processed image

主要目标是只保留文本并删除左侧的那些小黑线:

Black Lines

有人知道如何做到这一点吗?

感谢您的帮助。

最佳答案

您可以使用笔画宽度变换

一个example

关于C++:调整 Tesseract 以去除噪声元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35081560/

相关文章:

c++ - 是否可以在类初始化之前填充 const QHash (或类似的)?

c++ - OpenCV imwrite 不写入图像

python - 没有名为 tesseract 的模块

c++ - 对象的每个实例的方法是否在内存中重复?如果是这样,可以避免这种情况吗?

c++ - 用 str(const char*) 设置 std::stringstream 的内容会产生奇怪的后果

c++ - 在 C++11 中是否有等同于 boost::interprocess::null_mutex 的东西(例如 std::null_mutex)?

c++ - 在 OpenCV 中分配矩阵元素

c++ - OpenCV 超正方体

r - 超正方体 "Error in pixCreateNoInit: pix_malloc fail for data"

c++ - 在启用 OpenCL 选项的情况下使用 Tesseract 时出现 malloc 错误