c# - Html Agility Pack - 从 html 文档中获取 html 片段

标签 c# html html-agility-pack

使用 html 敏捷包;我如何从完整的 html 文档中提取 html“片段”?出于我的目的,一个 html“片段”被定义为 <body> 内的所有内容。标签。

例如:

示例输入:

<html>
   <head>
     <title>blah</title>
   </head>
   <body>
    <p>My content</p>
   </body>
</html>

期望的输出:

<p>My content</p>

理想情况下,如果内容不包含 <html>,我希望原封不动地返回内容或 <body>元素(例如,如果它不是完整的 html 文档,则假设首先向我传递了一个片段)

谁能指出我正确的方向?

最佳答案

我认为您需要分段进行。

您可以按如下方式为正文或 html 选择文档节点

doc.DocumentNode.SelectSingleNode("//body") // returns body with entire contents :)

然后您可以检查标准的空值,如果提供了空值,您可以按原样使用字符串。

希望对您有所帮助:)

关于c# - Html Agility Pack - 从 html 文档中获取 html 片段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4348520/

相关文章:

c# - 单线程和多线程应用程序的编译问题

c# - 来自单个 DotNet Core 项目配置文件的多个二进制文件

c# - 如何将 DataGridView 与 SqlDataReader 绑定(bind)

c# - 如何解析这段HTML?

c# - 为什么故意不优化这个循环?

用于删除非数字字符的 jQuery 正则表达式不起作用

html - 菜单在移动设备上扭曲页面并在右侧创建空白

javascript - 创建盒装/框架布局

c# - 使用 HtmlAgilityPack 抓取 url 内容会产生错误

vb.net - 带有 HTML Agility 包的 VB.NET 中的 XPath