<分区>
如何使用脚本从pdf文档中获取文本?我使用 Windows,偶尔使用 Linux。
<分区>
如何使用脚本从pdf文档中获取文本?我使用 Windows,偶尔使用 Linux。
最佳答案
您应该在大多数 Linux 发行版上都可以使用 pdftohtml
。顾名思义,它可以将 PDF 转换为 HTML。可以通过多种方式将 HTML 转换为纯文本,例如使用 lynx -dump file.html
关于windows - 使用脚本从pdf文档中获取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9443402/