tesseract - 使用 Tesseract-OCR 获取识别字符的字体

是否可以使用 Tesseract-OCR 获取已识别字符的字体，即它们是 Arial 还是 Times New Roman，无论是从命令行还是使用 API。

我正在扫描可能具有不同字体的不同部分的文档，拥有这些信息会很有用。

最佳答案

Tesseract 有一个 API WordFontAttributes在 ResultIterator 中定义的函数您可以使用的类。

关于tesseract - 使用 Tesseract-OCR 获取识别字符的字体，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15679017/

相关文章：

javascript - 停止返回 Tesseract js 识别属性