c# - 免费的 OCR SDK for .net 可以将文本、表格格式和图像提取到 Office word 文档中

标签 c# ocr image-recognition

<分区>

我想要一个免费的 OCR SDK,它可以从扫描的文档文件(.tiff、.png 等)中提取文本、包含数据的表格和图像,并存储到 Office Word 文档文件中。

请帮我解决这个问题。我已经使用 MODI 仅从图像中提取文本,但无法使用 MODI 如何提取表格和图像并将其存储到 Office Word 文档文件中。

最佳答案

我不确定开源 SDK 是否可以解决您的任务。根据您的描述,我发现您需要一个具有文档逻辑结构重建功能的复杂 ocr 应用程序。如果您正在规划商业软件,您可以查看 ABBYY FineReader Engine .它有一组 document analyzing and reconstruction features , 提供了 c# 的 api,可以免费试用。免费使用的程序价格不菲,但在商业软件方面 – ABBYY OCR 技术可以为您的产品增加重要值(value),因此请考虑尝试一下。我在 ABBYY 工作,如有必要可以为您提供更多信息。

最好的问候,尼古拉。

关于c# - 免费的 OCR SDK for .net 可以将文本、表格格式和图像提取到 Office word 文档中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7036185/

相关文章:

c# - 正则表达式需要很长时间才能完成

C# UTF8 输出保持编码字符完整

c# - 如何使用时间间隔在 Windows 窗体中的照片之间切换?

c# - NHibernate异常

asp.net - 如何在 ASP.Net Web 应用程序中使用 MODI?

python - 如何以编程方式删除黑色网格?

java - 如何使用 Java opencv 让 doOCR 正常工作

python - 为什么 pytesseract 无法识别背景较暗的图像中的数字?

image-processing - 正方形检测、图像处理

tensorflow - 图像分类器总是给出相同的结果 : Out of Ideas