我正在创建一个网站,作者可以在其中创建 EPUB文件。用户将以 .doc
格式上传他们的书籍。我需要从中创建 EPUB 文件。一个文档文件将包含多个章节。所以我需要解析 doc
文件并将其分成章节。作者将使用 Heading 1
作为他们的章节标题。
所以在 PHP
中,有什么方法可以将 doc
文件解析为 HTML
并使用 Heading 1< 将其分成章节
,以便我可以创建 EPUB 文件。
经过一些研究,我得到了一个 linux app .但我认为,它将 doc 转换为纯文本。所以我将无法拆分章节。
如果您有解决方案,请建议我。提前致谢。
最佳答案
您可以使用 PHPDOCX API 实现此目的.
首先尝试使用 this 从您的 Word 文档生成 XHTML功能引用
像这样的..
require_once '../../classes/TransformDoc.inc';
$document = new TransformDoc();
$document->setStrFile('../files/Text.docx');
$document->generateXHTML();
$document->validatorXHTML();
echo $document->getStrXHTML();
获取XHTML 内容后,您可以进行各种处理,例如removing chapter。 ,ETC。
可以找到完整的文档 here .
关于php - 是否可以使用 PHP 将 doc 文件转换为 HTML?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18327999/