javascript - 使用 javascript 剥离标签并处理换行符

标签 javascript sanitization strip-tags

我想从 html 中去除标签,但保留它的换行符。

我想要在浏览器中复制文本并将其粘贴到记事本中的行为。

例如,转换的代码:

  • <div>x1</div><div>x2</div>x1\nx2
  • <p>x1</p><p>x2</p>x1\nx2
  • <b>x1</b><i>x2</i>x1x2
  • x1<br>x2x1\nx2

删除所有标签无效 (/<.*?>/g)。 同时创建一个虚拟

并将其设置为 innertHTML并阅读它的textContent将删除换行符。

有什么帮助吗?

最佳答案

这对你来说怎么样?这将替换所有出现的 <br> , </div> , 和 </p>\n , 然后剥离剩余的标签。它很愚蠢,但它至少是一个开始。

fixed = text_to_fix.replace(/<(?:br|\/div|\/p)>/g, "\n")
           .replace(/<.*?>/g, "");

但这并不适用于所有 HTML,但是。只是你提到的标签。

关于javascript - 使用 javascript 剥离标签并处理换行符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6847556/

相关文章:

javascript - 带有 svg 图像分层的交互式 WebGL 背景

string - 最低限度的文本清理

.NET 库来清理输入?

javascript - 如何从文本区域获取输入的文本

javascript - 如何更改 Bootstrap 验证器图标位置

c# - 删除空白段落标签 - TinyMCE

PHP HTML strip_tags 除部分标签外的所有标签并删除标签内的样式

php - strip <br>(n12br) 从数据库字段获取

javascript - 如何处理来自多个 then in catch of javascript promises 的错误?

php - zend 框架清理数据