image-processing - 实时图像处理OCR应用的开源方式?

标签 image-processing open-source computer-vision ocr

关闭。这个问题需要更多focused .它目前不接受答案。












想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post .

6年前关闭。




Improve this question




我有一个想要制作的应用程序。我们有壁挂式日程表,这些日程表使用白色背景上的黑色线条分成小矩形。磁性姓名标签放置在特定分区中,以表明此人将在该单元格中工作。该系统非常适合人与人之间的交流,但我想要一种自动将此日程信息自动保存到数据库中的方法。

我正在设想一个系统,其中将相机设置在专注于日程安排板的固定位置。相机会定期拍摄电路板的照片。我想写一些代码来破译哪个名称标签在哪个区域。这将需要一些 OCR 或符号识别。每个名牌上都有大数字,我将用它来识别名牌所在的人。

在处理新的编程问题时,我很自然地会使用 Python。我找到了这个帖子 -> python image recognition这看起来是一个很好的起点(使用 PIL 和 numpy)。

你知道这样做的好方法吗?

更新:我已经尝试过 SimpleCV,现在看起来不错。

最佳答案

这实际上是一个非常困难的问题,尽管它看起来很简单。但是你可以通过对你的图像做一些事情来使它更容易管理。我有以下建议:

  • 尝试使您的相机使用合理的镜头直视电路板,以便边缘图像的失真最小,并且没有透视失真。
  • 鉴于您偶尔会拍摄用于分析的图像,我认为性能绝不是问题,因此拍摄高分辨率图像,使用闪光灯或长时间曝光(因为您拍摄的一切都是静止的)以获得最好的图像质量。
  • 如果您期望的不同标签的数量不是太多,您可能会发现通过 template matching 尝试在您的图像中匹配这些标签的引用图像会更容易。而不是对数字进行完整的 OCR。如果您的图像足够好,这将更容易开始工作。 python opencv interface非常完整。
  • High Performance Mark 对您关于包含 barcodes 的问题有很好的评论。在标签上。我会添加选项 QR codes ,但这只是一回事。两者都很容易检测,并且有很好的库可以帮助您阅读它们。
  • 如果您决定确实需要 OCR,您应该查看可用的 OCR 包,而不是尝试推出自己的。试试 pytessertesseract发动机或 OCRopus python interface .
  • 关于image-processing - 实时图像处理OCR应用的开源方式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9330744/

    相关文章:

    c# - 使用 C# 在图像中查找黑色正方形/矩形

    java - 适用于 Ubuntu 10.10 的 Eclipse 3.6 Helios

    python - 让 distutils 安装预编译的库?

    c++ - 引入旋转/缩放不变性后,OpenCV Orb 找不到匹配项

    opencv - 在 OpenCV 中量化描述符

    python - 基于显着性的部分信息寻找完整轮廓

    ios - 在 Swift ios 中使用 vImageBuffer_initWithCGImage 时出现 "fatal error: unexpectedly found nil while unwrapping an Optional value"

    matlab - Dicom:Matlab 与 ImageJ 灰度级

    version - 正确的第一个版本是什么? 0.1.0 或 0.0.1 还是其他?

    python - 将 YoloV3 输出转换为边界框、标签和置信度的坐标