php - 将中东语言的 doc 和 docx 文件批量转换为 utf-8 编码的 txt

标签 php mysql text docx doc

我有大约 7000 个用 Microsoft Word 用波斯语编写的 doc/docx 格式的文件。我想将它们全部转换为 txt 格式,而不丢失任何 php Web 应用程序的内容。我知道许多标题为 Converting doc to txt 的主题,但没有一个能解决我的问题。知道我该怎么做吗?

这是一个 link 到这些文件之一。

最佳答案

因为你找不到这么小的实用程序,所以我创建了一个:

https://github.com/edi9999/docx2txt

安装和使用:

npm install docx2txt -g
docx2txt input.docx

但是,这不会在段落之间添加空格。

也许你也可以使用 pandoc 来实现这一点:

pandoc 输入.docx -o 输出.txt

关于php - 将中东语言的 doc 和 docx 文件批量转换为 utf-8 编码的 txt,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27206627/

相关文章:

javascript - jQuery 提交需要点击 2 次才能运行

PHP 你能更新字符串中的变量吗?

php - 如果由 VB.Net Now() 插入,则操作 Mysql DB 中的 Var Char 列

MySQL Concat 和 GROUP BY

r - 使用 scale_y_log10 不会出现 geom_text

Python - 解析、分割文本并将其分成单独的行

php - Laravel 表单请求 : bad method be called

php - Laravel 5 实例化一个新的请求验证

c# - asp.net core 2显示指定的 key 太长;最大 key 长度为 3072 字节

python - 打印到 UTF-8 编码文件,使用平台相关的换行符?