ocr - ABBYY Flexicapture Layout/Setup 站可识别不同的事物

标签 ocr abbyy

当我在布局工作室中构建 ABBYY Flexicapture 布局时,它完美地捕获了所有内容。将布局保存并导出到设置站后,某些信息丢失,特别是重复组中的信息。

例如,在 Layout studio 的重复组中,我可以找到页面上列出的所有两个“税费”。所有这些都被认为质量良好,没有错误。但是,在设置站中,只会捕获 2 种税费中的 1 种。

FL studio Location_Taxes 重复 block FL studio Location_Taxes repeating block

FL Studio 已缴税 (2/2) FL Studio Captured Taxes (2/2)

税务重复组的特写 CLose up of Tax Repeating Group

FC Studio 缴税 (1/2) FC Studio Captured tax (1/2)

是否有什么我遗漏的东西会导致识别在布局工作室中工作,但在设置/捕获中不起作用?

谢谢

最佳答案

查看您的 ABBYY FlexiLayout 项目会有所帮助,因为可能有几个原因,我可以测试并确认解决方案。但我想我对这个问题看得够清楚了。

当您使用可重复的组元素捕获元素时,请确保将 FlexiLayout Studio 中“ block ”下的这些捕获结果公开到启用了“具有重复实例”(复选标记)的 block 中。这将显示 FlexiCapture 中的所有实例,而不仅仅是第一个捕获的实例。我认为这是你的问题,因为你说你在 FC 中只看到一个实例。

即使一切设置正确,您在 FlexiLayout 中看到的内容也有可能与 FlexiCapture 中的结果不匹配。但这种情况很少见,并且仅发生在特别复杂的文档或某些特定设置上。示例可能是在 FL 中看到 5 个实例,而在 FC 中仅获得 4 个实例。

伊利亚·叶夫多基莫夫

关于ocr - ABBYY Flexicapture Layout/Setup 站可识别不同的事物,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18108343/

相关文章:

Win7 64 位上 Abbyy 的 Java Com4j 接口(interface)

opencv - 图像预处理tesseract

c# - Tesseract 空白页

cmd - abbyy Finereader.exe 寻找 cmd 命令以在其他程序中使用

iphone - 适用于 iPhone 的 ABBYY 移动 OCR 引擎

machine-learning - 从中文文档中提取数据

<canvas> 上的 JavaScript 文本识别和 OCR

python - 无法使用 sort_contors 构建七段 OCR

python - 使用 pytesseract 时如何设置配置 load_system_dawg 以改善结果?

c# - 来自另一个进程的 Marshal 位图