<分区>
我想要一个免费的 OCR SDK,它可以从扫描的文档文件(.tiff、.png 等)中提取文本、包含数据的表格和图像,并存储到 Office Word 文档文件中。
请帮我解决这个问题。我已经使用 MODI 仅从图像中提取文本,但无法使用 MODI 如何提取表格和图像并将其存储到 Office Word 文档文件中。
<分区>
我想要一个免费的 OCR SDK,它可以从扫描的文档文件(.tiff、.png 等)中提取文本、包含数据的表格和图像,并存储到 Office Word 文档文件中。
请帮我解决这个问题。我已经使用 MODI 仅从图像中提取文本,但无法使用 MODI 如何提取表格和图像并将其存储到 Office Word 文档文件中。
最佳答案
我不确定开源 SDK 是否可以解决您的任务。根据您的描述,我发现您需要一个具有文档逻辑结构重建功能的复杂 ocr 应用程序。如果您正在规划商业软件,您可以查看 ABBYY FineReader Engine .它有一组 document analyzing and reconstruction features , 提供了 c# 的 api,可以免费试用。免费使用的程序价格不菲,但在商业软件方面 – ABBYY OCR 技术可以为您的产品增加重要值(value),因此请考虑尝试一下。我在 ABBYY 工作,如有必要可以为您提供更多信息。
最好的问候,尼古拉。
关于c# - 免费的 OCR SDK for .net 可以将文本、表格格式和图像提取到 Office word 文档中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7036185/