c# - 如何从无效的html中获取有效的html?

标签 c# .net html

我需要一种方法从无效的 html 中获取有效的 html(我在数据库中有脏记录,所以我需要通过它并处理每条记录)。

有效的标准是它可以作为 innerHtml 粘贴到 <div></div> 中。如果无法生成有效的 html,则它应该是一个空字符串。 我需要它做与 tinyMCE 一样的事情。看: http://fiddle.tinymce.com/v6baab

示例 1:

<div>hi there</span>

应该是

<div>hi there</div><span>hi there</span>

例子2:

<style> &amp;amp;amp;lt;!-- /* Font Definitions */ @font-face {font-family: 'Century Gothic';} --&amp;amp;gt; </style> AAAA

应该是

<p>AAAA</p>

实现此目标的最佳方法是什么?

最佳答案

您可以使用 SGMLReader:http://developer.mindtouch.com/SgmlReader

关于c# - 如何从无效的html中获取有效的html?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10633371/

相关文章:

c# - 对 Dictionary<int, double> 类型的 Linq 查询

c# - 将新项目添加到导航属性会导致 "Collection navigation properties must > implement ICollection<> of the target type"错误

javascript - 组合多个字段中的文本字段集

javascript - 使用 HTML5/JavaScript 构建数据网格

javascript - 在 div 中的特定点附加一个字符串

c# - ASP.NET WebApi JSON 响应和带有外键的实体

c# - 如何在多重绑定(bind)中获取父值

.net - 如何在单个节点中构建具有多个 xml 命名空间的 XmlDocument?

c# - 如何在散点图中绘制超过 50,000 个值,从而节省计算机资源?

c# - Expression<Func<TModel,TValue>> 我怎样才能得到 TValue 的名字?