我有原始 html,里面有一些用于各种标签的 css 类。
例子:
输入:
<p class="opener" itemprop="description">Lorem ipsum dolor sit amet, consectetur adipisicing elit. Neque molestias natus iste labore a accusamus dolorum vel.</p>
我想得到像这样的纯 html:
输出:
<p>Lorem ipsum dolor sit amet, consectetur adipisicing elit. Neque molestias natus iste labore a accusamus dolorum vel.</p>
我不知道这些类的名称。我需要在 JavaScript (node.js) 中执行此操作。
有什么想法吗?
最佳答案
这可以用 Cheerio 来完成,正如我在评论中指出的那样。
要删除所有元素的所有属性,您可以:
var html = '<p class="opener" itemprop="description">Lorem ipsum dolor sit amet, consectetur adipisicing elit. Neque molestias natus iste labore a accusamus dolorum vel.</p>';
var $ = cheerio.load(html); // load the HTML
$('*').each(function() { // iterate over all elements
this.attribs = {}; // remove all attributes
});
var html = $.html(); // get the HTML back
关于javascript - 如何从html中删除所有属性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21003384/