是否可以使用 Tesseract-OCR 获取已识别字符的字体,即它们是 Arial 还是 Times New Roman,无论是从命令行还是使用 API。
我正在扫描可能具有不同字体的不同部分的文档,拥有这些信息会很有用。
最佳答案
Tesseract 有一个 API WordFontAttributes
在 ResultIterator
中定义的函数您可以使用的类。
关于tesseract - 使用 Tesseract-OCR 获取识别字符的字体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15679017/