使用 html 敏捷包;我如何从完整的 html 文档中提取 html“片段”?出于我的目的,一个 html“片段”被定义为 <body>
内的所有内容。标签。
例如:
示例输入:
<html>
<head>
<title>blah</title>
</head>
<body>
<p>My content</p>
</body>
</html>
期望的输出:
<p>My content</p>
理想情况下,如果内容不包含 <html>
,我希望原封不动地返回内容或 <body>
元素(例如,如果它不是完整的 html 文档,则假设首先向我传递了一个片段)
谁能指出我正确的方向?
最佳答案
我认为您需要分段进行。
您可以按如下方式为正文或 html 选择文档节点
doc.DocumentNode.SelectSingleNode("//body") // returns body with entire contents :)
然后您可以检查标准的空值,如果提供了空值,您可以按原样使用字符串。
希望对您有所帮助:)
关于c# - Html Agility Pack - 从 html 文档中获取 html 片段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4348520/