c# - HTMLAgilityPack 剥离 html

标签 c#

我确信这个问题以前曾被问过,而且我之前也查过,但找不到答案,或者也许我只是做错了什么。

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
                doc.LoadHtml(indivdualfix[0]);             
                HtmlWeb hwObject = new HtmlWeb();
                HtmlAgilityPack.HtmlDocument htmldocObject = hwObject.Load(indivdualfix[0]);
                HtmlNode body = htmldocObject.DocumentNode.SelectSingleNode("//body");
                body.Attributes.Remove("style");
                foreach (var a in body.Attributes.ToArray())
                    a.Remove();
                string bodywork = body.InnerHtml.ToString();

字符串主体仍然返回所有的html编码。我可能在这里遗漏了一些很小的东西。需要做什么才能基本上删除所有 html 编码。

最佳答案

使用body.InnerText而不是body.InnerHtml

关于c# - HTMLAgilityPack 剥离 html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4727547/

相关文章:

c# - Fluent NHibernate 生成的列名别名太长

c# - exe和assembly可以运行在不同版本的.NET framework上吗?

c# - Linq 在多层上对 IEnumerable 进行排序

c# - 在 Canvas 上绘制单个点的有效方法

c# - 递归代替多个嵌套的 for 循环?

c# - 当大多数项目访问的数据库具有我无法更改的糟糕模式时,我如何对我的项目进行单元测试?

c# - 从 WPF 应用程序以编程方式关闭/打开 Wi-Fi

c# - 我的 WPF 组合框中的绑定(bind)不起作用?

c# - 系统UriFormatException : 'Invalid URI: The Uri scheme is too long.'

c# - 使用 Android.Support.V7.App.AppCompatActivity 时获取 ResourceNotFoundException