我想获取ppt文件中的内容(纯文本)。怎么做?
(喜欢我想获取txt文件中的内容,只需要打开阅读即可,获取ppt文件的信息需要怎么做?)
顺便说一句,我知道在windows系统中有一个win32com。但是现在我在 linux 上工作,有什么可能的方法吗?
最佳答案
我在 Superuser 上找到了这个讨论:
Command line tool in Linux to Extract Text From Word, Excel, Powerpoint?
那里列出了几个合理的答案,包括使用 LibreOffice 来执行此操作(以及用于 .doc
、.docx
、.pptx
、等等)和Apache Tika Project (在这个解决方案空间中似乎是 5,000 磅的 gorilla )。
关于python - 如何使用python读取ppt文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13565542/