image-processing - 实时图像处理OCR应用的开源方式？

关闭。这个问题需要更多focused .它目前不接受答案。

想改善这个问题吗？更新问题，使其仅关注一个问题 editing this post .

6年前关闭。

Improve this question

我有一个想要制作的应用程序。我们有壁挂式日程表，这些日程表使用白色背景上的黑色线条分成小矩形。磁性姓名标签放置在特定分区中，以表明此人将在该单元格中工作。该系统非常适合人与人之间的交流，但我想要一种自动将此日程信息自动保存到数据库中的方法。

我正在设想一个系统，其中将相机设置在专注于日程安排板的固定位置。相机会定期拍摄电路板的照片。我想写一些代码来破译哪个名称标签在哪个区域。这将需要一些 OCR 或符号识别。每个名牌上都有大数字，我将用它来识别名牌所在的人。

在处理新的编程问题时，我很自然地会使用 Python。我找到了这个帖子 -> python image recognition这看起来是一个很好的起点(使用 PIL 和 numpy)。

你知道这样做的好方法吗？

更新:我已经尝试过 SimpleCV，现在看起来不错。

最佳答案

这实际上是一个非常困难的问题，尽管它看起来很简单。但是你可以通过对你的图像做一些事情来使它更容易管理。我有以下建议:

尝试使您的相机使用合理的镜头直视电路板，以便边缘图像的失真最小，并且没有透视失真。

鉴于您偶尔会拍摄用于分析的图像，我认为性能绝不是问题，因此拍摄高分辨率图像，使用闪光灯或长时间曝光(因为您拍摄的一切都是静止的)以获得最好的图像质量。

如果您期望的不同标签的数量不是太多，您可能会发现通过 template matching 尝试在您的图像中匹配这些标签的引用图像会更容易。而不是对数字进行完整的 OCR。如果您的图像足够好，这将更容易开始工作。 python opencv interface非常完整。

High Performance Mark 对您关于包含 barcodes 的问题有很好的评论。在标签上。我会添加选项 QR codes ，但这只是一回事。两者都很容易检测，并且有很好的库可以帮助您阅读它们。

如果您决定确实需要 OCR，您应该查看可用的 OCR 包，而不是尝试推出自己的。试试 pytesser为 tesseract发动机或 OCRopus python interface .

关于image-processing - 实时图像处理OCR应用的开源方式？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9330744/

image-processing - 实时图像处理OCR应用的开源方式？

上一篇：entity-framework - Entity Framework 中存储过程的映射是全有还是全无？ (功能映射)

下一篇：entity-framework - Entity Framework 6 : is there a way to iterate through a table without holding each row in memory