javascript - 如何从html中删除所有属性?

标签 javascript html node.js text-processing text-parsing

我有原始 html,里面有一些用于各种标签的 css 类。

例子:

输入:

<p class="opener" itemprop="description">Lorem ipsum dolor sit amet, consectetur adipisicing elit. Neque molestias natus iste labore a accusamus dolorum vel.</p>

我想得到像这样的纯 html:

输出:

<p>Lorem ipsum dolor sit amet, consectetur adipisicing elit. Neque molestias natus iste labore a accusamus dolorum vel.</p>

我不知道这些类的名称。我需要在 JavaScript (node.js) 中执行此操作。

有什么想法吗?

最佳答案

这可以用 Cheerio 来完成,正如我在评论中指出的那样。
要删除所有元素的所有属性,您可以:

var html = '<p class="opener" itemprop="description">Lorem ipsum dolor sit amet, consectetur adipisicing elit. Neque molestias natus iste labore a accusamus dolorum vel.</p>';

var $ = cheerio.load(html);   // load the HTML

$('*').each(function() {      // iterate over all elements
    this.attribs = {};     // remove all attributes
});

var html = $.html();          // get the HTML back

关于javascript - 如何从html中删除所有属性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21003384/

相关文章:

html - CSS 根本不工作

javascript - 下拉菜单中 <li> 元素的 .click 事件 (jQuery) (Bootstrap)

javascript - 为什么我的边栏在缩小时消失了?

javascript - 如何重新运行/重用类构造函数

javascript - 如何避免 Angular 中的元素重叠

javascript - 允许用户调用 JSON 对象的元素

javascript - 如何在字符串中搜索多维数组中找到的关键字?

node.js - 使用 nodejs 的 SOAP 请求

Node.js Web 服务器 fs.createReadStream 与 fs.readFile?

javascript - createDataChannel中label的作用是什么,如何正确使用?