html - 去除除链接之外的所有 HTML 标签

标签 html regex actionscript-3 string tags

我正在尝试编写一个正则表达式来去除所有 HTML,链接除外(分别为 <a href</a> 标签。它不必 100% 安全(我不担心注入(inject)攻击或我正在解析已经批准并发布到 SWF 电影中的内容)。

我使用的原始“剥离标签”正则表达式是 <(.|\n)+?> , 我尝试将其修改为 <([^a]|\n)+?> ,但这当然会允许任何包含 a 的标签,而不是开头带有空格的标签。

并不是说这真的很重要,但以防万一有人想知道我在 ActionScript 3.0 中写这篇文章对于 Flash电影。

最佳答案

<(?!\/?a(?=>|\s.*>))\/?.*?>

试试这个。对 p 标签有类似的东西。为他们工作所以不明白为什么不。使用否定前瞻来检查它是否不匹配(以可选/字符为前缀),其中(使用正前瞻)a(带有可选/前缀)后跟 > 或空格,然后是 >。然后匹配直到下一个 > 字符。把它放在

的替代中
s/<(?!\/?a(?=>|\s.*>))\/?.*?>//g;

这应该只留下开始和结束标签

关于html - 去除除链接之外的所有 HTML 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44078/

相关文章:

html - 如何设置 Facebook 和 Twitter 分享按钮的样式?

javascript - jQuery 滚动条插件

双倍的正则表达式

Python:当字典键中有 ',' 时,为什么 re.sub 不将字典键替换为字典值

actionscript-3 - 在 swc-library (actionscript3) 中停止跟踪

css - 在 Bootstrap 中调整下拉菜单的大小

javascript - Google Chart 无法为水平轴 (hAxis) 着色

java - 后视很慢

actionscript-3 - 设置swf高度和宽度时视频消失

actionscript-3 - 提供的 DisplayObject 必须是调用者的子对象