在您将其标记为重复之前,我搜索了 SO 并使用了许多正则表达式,但没有得到我正在寻找的结果。
我正在解析 html 电子邮件的内容,电子邮件的样式和 html 正在改变我的页面样式。
如何从这些字符串中删除所有 CSS 和 HTML。我试过正则表达式,但我总是会丢失 HTML 中的一些内容。
我认为 PHP 有一个 strip_tags 函数?这非常有效。在 javascript/jquery 中有类似的东西吗?
或者该函数的算法是什么,我如何将它移植到 js/jquery?或者更好的东西,效果很好。
这是我正在配对的字符串的示例:http://pastebin.com/bw8zMNs9
最佳答案
正则表达式不适合解析 HTML。 jQuery.text()似乎做你想做的事。 试试这个:
$htmlString = $("<div>" + YOUR_HTML_STRING + "</div>");
$htmlString.find("style").remove();
$htmlString.find("script").remove();
var rawText = $htmlString.text();
在这里试试:JSFiddle
关于javascript - 去除 HTML 标签,但保留内容(javascript/jquery),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26572476/