javascript - 任何基于 JavaScript/jQuery 的 html 数据处理器/美化器?

标签 javascript jquery html node.js dom

<分区>

我需要在服务器端处理“脏”html 数据。因为我在服务器端使用 Node.JS 和 jQuery,所以我能够使用 JS 和 jQuery DOM 解析器的所有功能来处理我的 html 内容。

“脏”数据意味着:

<br ><br />Home <a href="http://habrahabr.ru/post/169139/"> gamy code </ a> 
<br>
Technique: <a href="http://habrahabr.ru/post/173903/"> Preparation methods </ a> <br>
<br>
In continuation, the technique based on the book Refactoring Refactoring <a href="http://www.ozon.ru/context/detail/id/1308678/">. Improvement of existing code by Martin Fowler. </ A> <br>
  <a href="http://habrahabr.ru/post/174779/#habracut"> Read more → </ a>

因此,它可能在开头/中间有几个 br,空 p 等。我尝试使用

$('*:empty').remove();

但是,如果帖子开始形式

Home <a href="http://habrahabr.ru/post/169139/"> gamy code </ a> <br>

删除“

那么,是否有可靠的基于 JS/jQuery 的生产就绪解决方案来美化 html 数据以删除开头的空标签/中间的双 br/p 等?

附注不想使用简单的正则表达式,因为在这种肮脏的内容中可能会发生很多不同的情况

最佳答案

有一个名为 jQuery-Clean 的插件在这种情况下可能会有所帮助:https://code.google.com/p/jquery-clean/

此插件执行以下操作:

  • 修复自闭标签
  • 小写标签
  • 删除非标准属性
  • 删除行内样式属性
  • 删除内联事件属性
  • 可选择删除其他属性
  • 整理不必要的空白和新行
  • 删除评论
  • 删除专有的文字格式标签
  • 替换标签,例如我=>他们
  • 可选择保留 CSS 类
  • 格式化和缩进 html

不幸的是,我无法找到其他任何东西。我觉得我必须说,可能有必要编写一些正则表达式来完成您正在寻找的内容。

关于javascript - 任何基于 JavaScript/jQuery 的 html 数据处理器/美化器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15982500/

相关文章:

javascript - 使用 JavaScript 在新标签元素中创建标签元素

javascript - 为什么这段代码日志返回 false?

jquery - 如何检测滚动方向

jquery - 在ajax加载的内容中预加载图像

javascript - 如何在页面加载时增加浏览器缩放级别?

javascript - 在 RaphaelJS 中拖放

javascript - 印度货币的输入掩码在 Jquery 动态输入字段中

javascript - 是否有任何方法在成功之前被调用?

php - 如何通过AJAX发回大量不同的数据

PHP 包括。我似乎无法弄清楚