php - 是否可以使用 PHP 将 doc 文件转换为 HTML?

标签 php linux

我正在创建一个网站,作者可以在其中创建 EPUB文件。用户将以 .doc 格式上传他们的书籍。我需要从中创建 EPUB 文件。一个文档文件将包含多个章节。所以我需要解析 doc 文件并将其分成章节。作者将使用 Heading 1 作为他们的章节标题。

所以在 PHP 中,有什么方法可以将 doc 文件解析为 HTML 并使用 Heading 1< 将其分成章节,以便我可以创建 EPUB 文件。

经过一些研究,我得到了一个 linux app .但我认为,它将 doc 转换为纯文本。所以我将无法拆分章节。

如果您有解决方案,请建议我。提前致谢。

最佳答案

您可以使用 PHPDOCX API 实现此目的.

首先尝试使用 this 从您的 Word 文档生成 XHTML功能引用

像这样的..

require_once '../../classes/TransformDoc.inc';

$document = new TransformDoc();
$document->setStrFile('../files/Text.docx');
$document->generateXHTML();
$document->validatorXHTML();
echo $document->getStrXHTML();

获取XHTML 内容后,您可以进行各种处理,例如removing chapter。 ,ETC。

可以找到完整的文档 here .

关于php - 是否可以使用 PHP 将 doc 文件转换为 HTML?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18327999/

相关文章:

linux - 如何在 Linux 中使用共享库的同一进程的实例之间共享共享库 (.so) 中的全局变量?

php - 如何用外键存储地理位置?

linux - 使用 cron 防止 Bash 脚本并行运行或重叠

c - 构建 Linux 调试器 C

php - laravel5 中的 MassAssignmentException

c - 如何在写入前检查管道是否打开?

linux - 预认证失败 : Password read interrupted while getting initial credentials

php - 日期进度条 PHP

php - 在 Laravel 中组织计算代码 : Models or Controllers?

php - 相同的形式但有输入做其他事情