python - 在 AWS Lambda 上使用 Python 将 MS Word(.doc 和 .docx)文件转换为 HTML

标签 python aws-lambda libreoffice openoffice.org

尝试在 AWS Lambda 上使用 Python 将 MS Word 文件转换为 HTML。对于 .docx,我知道有一个名为 python-docx 的库。但是当涉及到 .doc 时,我仍然找不到优雅和简单的解决方案,因为大多数可能的解决方案都使用 LibreOffice 或 OpenOffice。

有没有一种方法可以制作可由 AWS Lambda 上的 Python 脚本操作的 LibreOffice/OpenOffice 的便携版本?或者,是否有我忽略的 .doc 文件的 Python 库?

最佳答案

如果您正在寻找在 AWS Lambda 中运行的 LibreOffice,这可能会对您有所帮助。最近我设法创建了一个在 Lambda 中运行的便携版本。

https://github.com/vladgolubev/serverless-libreoffice

关于python - 在 AWS Lambda 上使用 Python 将 MS Word(.doc 和 .docx)文件转换为 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40871288/

相关文章:

amazon-web-services - Datadog 中的 AWS Cloudwatch 警报

node.js - 我的 Alexa 技能在欧洲有效,但在美国无效

node.js - 如何在 AWS Lambda 中使用 Node pg?

date - 给定 ISO 8601 周数,在 LibreOffice Calc 电子表格中获取该周第一天的日期

从 LibreOffice Writer 导出 HTML

SQL 计数和求和

python - 随机分割数据帧(取决于唯一值)

java - 字符串类内部 - 如果使用 UTF-8,缓存字符偏移到字节关系

python - 判断图像是亮的还是暗的

python - 记录枚举类有困难吗?