javascript - 如何从 HTML 文档中获取仅文本(无标签)？

我有一个 HTML 页面，我只需要文本(所有文本节点)。

示例 HTML

<span>hello <strong>sir</strong></span>

期望的输出

hello sir

最佳答案

假设您只想要 body 元素的子元素...

示例 HTML

<html><head>
  <meta http-equiv="content-type" content="text/html; charset=UTF-8">
  <title> Example</title>
</head>
<body>
  a <div>b<span>c</span></div>
</body></html>

JavaScript

var body = document.body;
var textContent = body.textContent || body.innerText;

console.log(textContent);  //   a bc

您需要检查 textContent，因为我们的好 friend IE 使用 innerText。

如果你有一个像jQuery 这样的图书馆，事情就会容易得多。，即 $('body').text()。

也可以在服务器端实现，如strip_tags()在 PHP 中。但是，如果您只想要 body 元素，则需要使用 DOM 解析器(例如 DOMDocument)向下钻取它。 .

关于javascript - 如何从 HTML 文档中获取仅文本(无标签)？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5321739/

上一篇：javascript - 重用 jQuery 选择元素的最有效方式

下一篇：javascript - Ext.apply 与简单地在目标上设置值有什么区别？

C# 或 F# 用于解析类似 Slim 的缩进敏感语言？

c - 如何在 C 语言的 shell 中执行带有多个参数的命令？

python - 可迭代 float ？

javascript - Bootstrap Modal 和 PartialView 中的 ASP.net MVC 4 验证

javascript - 设置后React状态为空

javascript - 计算具有绝对定位子项的容器的高度

javascript - PureScript 乘积和类型上的 JS 模式匹配

python - 在python中解析GSM调制解调器接收到的消息参数

python - 在Python中使用多个分隔符进行解析