如何转换hOCR到 HTML 以进行可视化?
如果您打开原始 hOCR 文件,它只会呈现为纯文本(元素未定位)
最佳答案
这个任务有不同的解决方案,我知道这三个:
https://github.com/kba/hocrjs (将 hocr 数据覆盖在图像上,不同的选项如何显示)
https://github.com/not-implemented/hocr-proofreader (显示左侧的图像和右侧的 hocr 数据,可用于输入更正)
所有这些存储库似乎主要由一些 JavaScript 和 CSS 文件组成。前两个 repo 协议(protocol)都有一个链接到我从中拍摄照片的一些演示页面。
第一个提供了一个 Greasemonkey/Tampermonkey 脚本,它允许在任何合适的在线和本地 hocr 网站上注入(inject)这个覆盖(一些配置可能是可能的)。我不知道将其他解决方案用于您自己的 hocr 文件有多困难,但它应该是可行的。
关于html - HOCR 到 HTML 以进行可视化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38361243/