我想从 html 中去除标签,但保留它的换行符。
我想要在浏览器中复制文本并将其粘贴到记事本中的行为。
例如,转换的代码:
-
<div>x1</div><div>x2</div>
至x1\nx2
-
<p>x1</p><p>x2</p>
至x1\nx2
-
<b>x1</b><i>x2</i>
至x1x2
-
x1<br>x2
至x1\nx2
删除所有标签无效 (/<.*?>/g)。 同时创建一个虚拟
innertHTML
并阅读它的textContent
将删除换行符。
有什么帮助吗?
最佳答案
这对你来说怎么样?这将替换所有出现的 <br>
, </div>
, 和 </p>
用\n
, 然后剥离剩余的标签。它很愚蠢,但它至少是一个开始。
fixed = text_to_fix.replace(/<(?:br|\/div|\/p)>/g, "\n")
.replace(/<.*?>/g, "");
但这并不适用于所有 HTML,但是。只是你提到的标签。
关于javascript - 使用 javascript 剥离标签并处理换行符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6847556/