php - 什么是智能标签以及如何从 html 中删除它们?

标签 php html parsing smart-tags

所以我还在研究这个解析器。今天我发现了一个带有标签 <st1:place w:st="on"> 的文档Google 告诉我这是一个 Microsoft Office 智能标签。

我想摆脱这些东西,但找不到它们是什么或它们有多少的列表?

如果他们都遵循<...:...>使用正则表达式可以轻松删除的模式。

该文档没有文档类型和.jsp 扩展名,但所有内容都在两个<html> 之间。标签,无论野兽多么不标准,我仍然需要解析它。

好吧,这实际上不是什么大问题,但它会影响我的格式并让我感到烦恼。

最佳答案

这个正则表达式应该可以解决问题:

/<[:alnum:]+:[\s\S]*>/

它会在任何以 < 开头的标签上触发,后跟字母数字模式和“:”冒号。

或者:

/<\s*[:alnum:]+:[\s\S]*>/

将允许更宽松的标签格式化程序(开头 < 和命名空间之间的空格)

关于php - 什么是智能标签以及如何从 html 中删除它们?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4929705/

相关文章:

php - 如何将数据数组从数据库反序列化为html格式

parsing - 综合和继承属性

html - 旋转 float div 旁边的 div

javascript - 使用 innerHTML 重新加载页面的中心 Pane

c# - 如何在不丢失 TZinfo 的情况下解析此 DateTime?

xml - XML 文件中的数据 : One large file or multiple small ones?

php - 在 handle 函数中获取中间件 laravel 中的请求值

php - Apache 服务器日志错误。 AH00126 : Invalid URI in request GET, 等

php - 我尝试从同一数据库的 4 个不同表中获取信息

javascript - phpMyAdmin 发生致命 Javascript 错误