我有带有 HTML 标签的字符串文本(例如俄语) 我需要使用 JavaScript RegEx 获取所有单词并排除 HTML 标签
这是我的正则表达式
reg = /([^\r\n\t\f>< /]+(?!>))\b/g;
例如,在俄语中,我需要将所有 HTML 标记保留在字符串文本中,但将所有工作保留为俄语 ([\wа-я]+)
是否可以在 JavaScript RegEx 中排除和包含某些内容?
最佳答案
我不会尝试用正则表达式解析 HMTL。相反,获取 DOM 节点的 innerText
属性:
HTML:
<div id="myRussianText">
Lorem <span>ipsum</span>
</div>
JS:
var el = document.getElementById('myRussianText');
var text = el.innerText; // 'Lorem ipsum'
关于javascript - 包含 HTML 标签但仅包含字符列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36282357/