好的,这就是我想要一个 php 脚本来打开和读取用户上传的 Word 文档,并获取文档中的电子邮件地址并将其存储到数据库中。
只有电子邮件地址!它会像
电子邮件:someone@example.com 或类似“电子邮件是 someone@example.com”
任何格式.. 可以肯定的是会有空格分隔电子邮件 ID 和其他单词。有人能帮我吗 ? :D
最佳答案
这确实有点宽泛。从根本上说,您需要处理以下步骤:
上传word文档
您需要让用户上传文件。有一个 tutorial at w3schools这应该让你开始
解析内容
Office 文件很复杂 - 每个文件在技术上都是一个完整的文件系统,因为您可以嵌入图像、其他文档等...新的 .docx
实际上只是带有一些 XML 的 zip 文件 - 试试将其中一个重命名为 .zip
并打开它。旧式 .doc
是一种专有的 MS 格式,虽然同样复杂,但更加模糊。 This library似乎可以将 word 文件转换为 html,这可能会使它们更容易阅读。
查找电子邮件地址
我怀疑您最好的机会是使用正则表达式从正文中提取电子邮件地址。如果有多个电子邮件地址怎么办?这是一个 introduction to email regexes这可能会有一些帮助。 This answer是为了同样的事情
要获得更详细的答案,您必须提供更具体的问题。
关于PHP读取word文档只获取Email地址,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11600869/