javascript - 包含 HTML 标签但仅包含字符列表

标签 javascript regex

我有带有 HTML 标签的字符串文本(例如俄语) 我需要使用 JavaScript RegEx 获取所有单词并排除 HTML 标签

这是我的正则表达式

reg = /([^\r\n\t\f>< /]+(?!>))\b/g;

例如,在俄语中,我需要将所有 HTML 标记保留在字符串文本中,但将所有工作保留为俄语 ([\wа-я]+)

是否可以在 JavaScript RegEx 中排除和包含某些内容?

最佳答案

我不会尝试用正则表达式解析 HMTL。相反,获取 DOM 节点的 innerText 属性:

HTML:

<div id="myRussianText">
    Lorem <span>ipsum</span>
</div>

JS:

var el = document.getElementById('myRussianText');
var text = el.innerText; // 'Lorem ipsum'

https://jsfiddle.net/cn0np3yf/

关于javascript - 包含 HTML 标签但仅包含字符列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36282357/

相关文章:

java - 使用 Java 替换来自阿拉伯语推文的表情符号 Unicode 范围

javascript - 一次按数字对值排序,第二次按字符串排序

javascript - 忽略 HTML 标签以突出显示匹配的单词

javascript - 键入时更改页面标题

javascript - 将音频从 nodejs 流式传输到 html5 音频标签

ruby - 为什么这个正则表达式匹配/\w+[^(]/?

regex - 在 perl 中打印模式

javascript - Litelement 将对象作为 html 属性传递

javascript - jQuery 图像交换 if else

javascript - 我该如何改进这个 JavaScript 碰撞检测?