c# - 使用 Html Agility Pack 抓取 H3 的 InnerText

标签 c# html-agility-pack

我将如何只选择此 h3 中的周数而不选择其中的 span 标签?

仅选择包含 span 的 H3 会导致将一些 ascii 文本添加到生成的消息框中。

结果:

 Week 1

源文件:

<h3>
<span> </span>Week 1</h3>

代码:

private void getWeekNumber(string url)
{
    HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();

    htmlDoc.Load(new System.IO.StringReader(url));

    foreach (HtmlAgilityPack.HtmlNode h3 in htmlDoc.DocumentNode.SelectNodes("//h3"))
    {
        MessageBox.Show(h3.InnerText);
    }
}

最佳答案

在显示消息框之前尝试使用 RemoveChild(...) 删除跨度节点。

更多信息:

html agility pack remove children

关于c# - 使用 Html Agility Pack 抓取 H3 的 InnerText,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11526636/

相关文章:

c# - 递归搜索嵌套列表并获取父级

c# - HtmlAgility :no contents appeared (C#, UWP)

c# - ASP.NET IAuthorizationFilter OnAuthorization

C# 如何使用 Linq 解析 Object[] 以查找所有 List<Int> 对象?

c# - 使用 openXML 2.0 保存 Excel 文档时文件已损坏且无法打开

c# - 查找计算机上的总物理内存,.NET core 2.1,c#,Ubuntu

c# - 有没有更简单的方法将此日期重新格式化为 c# 中的短日期?

c# - 使用 HtmlAgilityPack 获取 href innertext

C# html agility pack 按类名获取元素

c# - 使用 HTMLAgilityPack 将节点附加到内部文本