PHP读取word文档只获取Email地址

标签 php ms-word docx doc

好的,这就是我想要一个 php 脚本来打开和读取用户上传的 Word 文档,并获取文档中的电子邮件地址并将其存储到数据库中。

只有电子邮件地址!它会像

电子邮件:someone@example.com 或类似“电子邮件是 someone@example.com”

任何格式.. 可以肯定的是会有空格分隔电子邮件 ID 和其他单词。有人能帮我吗 ? :D

最佳答案

这确实有点宽泛。从根本上说,您需要处理以下步骤:

上传word文档

您需要让用户上传文件。有一个 tutorial at w3schools这应该让你开始

解析内容

Office 文件很复杂 - 每个文件在技术上都是一个完整的文件系统,因为您可以嵌入图像、其他文档等...新的 .docx 实际上只是带有一些 XML 的 zip 文件 - 试试将其中一个重命名为 .zip 并打开它。旧式 .doc 是一种专有的 MS 格式,虽然同样复杂,但更加模糊。 This library似乎可以将 word 文件转换为 html,这可能会使它们更容易阅读。

查找电子邮件地址

我怀疑您最好的机会是使用正则表达式从正文中提取电子邮件地址。如果有多个电子邮件地址怎么办?这是一个 introduction to email regexes这可能会有一些帮助。 This answer是为了同样的事情

要获得更详细的答案,您必须提供更具体的问题。

关于PHP读取word文档只获取Email地址,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11600869/

相关文章:

vba - 查找包含直撇号(相对于卷撇号)的单词

php - 查找多维数组的键

javascript - 检索部分 jquery 响应以填充输入和选择

VBA 写入 Word,更改字体格式

python - 如何使用 Python 在 DOCX 文件中创建表?

docx - pandoc 跳过 latex 环境

c# - 使用 OpenXML 2.5 将数据写入 docx 文档中的 TextInput 元素

php - Sendmail Wamp Php

javascript - PHP 认为它正在写入 .txt 文件,但实际上不是

javascript - 使用 javascript 对 MSword 文档文本进行分页