不过我有这段 html 需要解析
<p class="feature_list">
<img src="candy.gif" alt="candy" title="candy"/>
x 3
<img src="lollies.gif" alt="lollies" title="lollies"/>
1
<img src="system.gif" alt="system" title="system"/>
x 1
<img src="phone.gif" alt="phone" title="phone"/>
x 1
</p>
如您所见,有一张图片,然后是旁边的文本,如“x 3”。
我想做的是浏览每张图片,并记录旁边的文字。但是,文本位于“img”标签之外。
我想知道是否可以使用 HTML 敏捷包执行此操作?
最佳答案
以下代码:
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.Load(yourHtml);
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//img"))
{
Console.WriteLine(HtmlEntity.DeEntitize(node.NextSibling.InnerText).Trim());
}
将输出:
x 3
1
x 1
x 1
注意简化 HTML 实体处理的 HtmlEntity 实用程序(如
)
关于c# - 使用 HTML Agility Pack 获取图像旁边的文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6240553/