javascript - 如何从 HTML 文档中获取仅文本(无标签)?

标签 javascript parsing

我有一个 HTML 页面,我只需要文本(所有文本节点)。

示例 HTML

<span>hello <strong>sir</strong></span>

期望的输出

hello sir

最佳答案

假设您只想要 body 元素的子元素...

示例 HTML

<html><head>
  <meta http-equiv="content-type" content="text/html; charset=UTF-8">
  <title> Example</title>
</head>
<body>
  a <div>b<span>c</span></div>
</body></html>

JavaScript

var body = document.body;
var textContent = body.textContent || body.innerText;

console.log(textContent);  //   a bc

您需要检查 textContent,因为我们的好 friend IE 使用 innerText

如果你有一个像jQuery 这样的图书馆,事情就会容易得多。 ,即 $('body').text()

也可以在服务器端实现,如strip_tags()在 PHP 中。但是,如果您只想要 body 元素,则需要使用 DOM 解析器(例如 DOMDocument)向下钻取它。 .

关于javascript - 如何从 HTML 文档中获取仅文本(无标签)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5321739/

相关文章:

javascript - Google Maps API 街景 View 未按模式调整大小

C# 或 F# 用于解析类似 Slim 的缩进敏感语言?

c - 如何在 C 语言的 shell 中执行带有多个参数的命令?

python - 可迭代 float ?

javascript - Bootstrap Modal 和 PartialView 中的 ASP.net MVC 4 验证

javascript - 设置后React状态为空

javascript - 计算具有绝对定位子项的容器的高度

javascript - PureScript 乘积和类型上的 JS 模式匹配

python - 在python中解析GSM调制解调器接收到的消息参数

python - 在Python中使用多个分隔符进行解析