我有大约 7000 个用 Microsoft Word 用波斯语编写的 doc/docx
格式的文件。我想将它们全部转换为 txt 格式,而不丢失任何 php Web 应用程序的内容。我知道许多标题为 Converting doc to txt
的主题,但没有一个能解决我的问题。知道我该怎么做吗?
这是一个 link 到这些文件之一。
最佳答案
因为你找不到这么小的实用程序,所以我创建了一个:
https://github.com/edi9999/docx2txt
安装和使用:
npm install docx2txt -g
docx2txt input.docx
但是,这不会在段落之间添加空格。
也许你也可以使用 pandoc 来实现这一点:
pandoc 输入.docx -o 输出.txt
关于php - 将中东语言的 doc 和 docx 文件批量转换为 utf-8 编码的 txt,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27206627/