html - HOCR 到 HTML 以进行可视化

标签 html ocr hocr

如何转换hOCR到 HTML 以进行可视化?

如果您打开原始 hOCR 文件,它只会呈现为纯文本(元素未定位)

最佳答案

这个任务有不同的解决方案,我知道这三个:

所有这些存储库似乎主要由一些 JavaScript 和 CSS 文件组成。前两个 repo 协议(protocol)都有一个链接到我从中拍摄照片的一些演示页面。

第一个提供了一个 Greasemonkey/Tampermonkey 脚本,它允许在任何合适的在线和本地 hocr 网站上注入(inject)这个覆盖(一些配置可能是可能的)。我不知道将其他解决方案用于您自己的 hocr 文件有多困难,但它应该是可行的。

关于html - HOCR 到 HTML 以进行可视化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38361243/

相关文章:

javascript - 在多次打开的列表之间移动

python - 将 hOCR 转换为 HTML 表格

html - 在使我的布局灵活以适应更多内容方面,我做错了什么?

javascript - 从 html 获取 href 属性会产生不需要的结果

javascript - 如何使用jquery在没有iframe的情况下获取body的innerHtml

python - 从 tesseract hocr xhtml 文件中提取数据

tesseract - 从 tika-server 获取 hocr 输出

c++ - 提高 tesseract ocr 结果的质量

ios - 在 iPhone 中使用 Tesseract OCR 从驾驶执照中读取数据

ios - ABBYY Cloud OCR SDK 返回空的 authToken 作为响应?