javascript - 正则表达式获取 HTML 标签之间的单词

标签 javascript html regex

我有这个字符串:

<p><ins>Article </ins>Title</p> 

<p>Here&#39;s some sample text</p>

我想将忽略 html 标签的单词放入数组,即

['Article','Title','Here&#39;s','some','sample','text']

我试图创建一个正则表达式,但它不会成功。 提前致谢。

最佳答案

将它们放入虚拟 div 中并获取 innerText

var str = `<p><ins>Article </ins>Title</p> 
<p>Here&#39;s some sample text</p>`;

var div = document.createElement( "div" );
div.innerHTML = str; //assign str as innerHTML
var text = div.innerText; //get text only

var output = text.split( /\s+/ ); //split by one or more spaces including line feeds
console.log( output );

关于javascript - 正则表达式获取 HTML 标签之间的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47938095/

相关文章:

javascript - jQuery 委托(delegate)事件绑定(bind)不起作用?

javascript - 通过figure id访问figcaption和img

html - @font-face 字体在本地工作正常但是当推送到服务器时它只是显示为默认 HTML 字体

Java : how to get text between "http://" and first following "/" occurence ? 在第一次 "/"出现之后?

javascript - 如何使用正则表达式取消选中单选按钮?

javascript - 大写javascript中的第一个字母

javascript - 单击按钮即可创建警报

javascript - innerHTML 和 addEventListener 不适用于 html 和 javascript 网站

javascript - 将 div 更改为绝对位置时,它会跳转到原始位置

java - 重构这种可能导致大输入 Sonar 堆栈溢出的重复