windows - 使用脚本从pdf文档中获取文本

标签 windows linux bash

<分区>

如何使用脚本从pdf文档中获取文本?我使用 Windows,偶尔使用 Linux。

最佳答案

您应该在大多数 Linux 发行版上都可以使用 pdftohtml。顾名思义,它可以将 PDF 转换为 HTML。可以通过多种方式将 HTML 转换为纯文本,例如使用 lynx -dump file.html

关于windows - 使用脚本从pdf文档中获取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9443402/

相关文章:

linux - 针对 Active Directory 验证登录凭据(适用于受工作站限制的用户)

Python - 快速更改桌面背景

c - 如何通过execvp()获取进程启动的进程ID

linux - SSH 隧道无法重新打开。没有权限

linux - 测试文件中的每一行是否包含另一个文件中的多个字符串之一

bash - 使用字符串在 bash 中进行循环控制

linux - Bash 从包含空格的路径中删除文件

python - 获取外部 ip 列表并在 Python 中转换为变量 dic

windows - 使用 OpenNI2 和 NiViewer 初始化 StructureSensor 时出错

Linux grep 命令,相关值作为输出