我正在寻找一种服务器端方法,使用 python 编程语言将 doc 文件转换为 docx 或 pdf 格式,而不使用 win32.client
、comtypes
和API。我正在 Azure 云服务上使用它。所以如果还有其他方法请帮忙!
最佳答案
有几种方法:
- 使用unoconv:
unoconv -d document --format=docx test.doc
- 使用 lowriter:
lowriter --convert-to docx test.doc
- 使用 soffice:
soffice --headless --convert-to docx test.doc
- 使用 libreoffice:
libreoffice --convert-to docx test.doc
您可以直接从终端运行这些命令,但如果您愿意,可以将它们集成到 python 中,如 described here :
#!/usr/bin/env python
import glob
import subprocess
for doc in glob.iglob("*.doc"):
subprocess.call(['soffice', '--headless', '--convert-to', 'docx', doc])
在示例中,我使用的是 soffice
,但您现在可以替换 unoconv
、lowriter
或 libreoffice
。
关于python - 是否有任何包可以在Azure中使用python编程将doc文件转换为docx格式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60632421/