c# - Html Agility Pack - 从 html 文档中获取 html 片段

使用 html 敏捷包；我如何从完整的 html 文档中提取 html“片段”？出于我的目的，一个 html“片段”被定义为 <body> 内的所有内容。标签。

例如:

示例输入:

<html>
   <head>
     <title>blah</title>
   </head>
   <body>
    <p>My content</p>
   </body>
</html>

期望的输出:

<p>My content</p>

理想情况下，如果内容不包含 <html>，我希望原封不动地返回内容或 <body>元素(例如，如果它不是完整的 html 文档，则假设首先向我传递了一个片段)

谁能指出我正确的方向？

最佳答案

我认为您需要分段进行。

您可以按如下方式为正文或 html 选择文档节点

doc.DocumentNode.SelectSingleNode("//body") // returns body with entire contents :)

然后您可以检查标准的空值，如果提供了空值，您可以按原样使用字符串。

希望对您有所帮助:)

关于c# - Html Agility Pack - 从 html 文档中获取 html 片段，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4348520/

相关文章：

c# - 单线程和多线程应用程序的编译问题