C# 从网站抓取数据

标签 c# html-agility-pack

嗨,我是 C# 领域的新手。自今年年初以来一直在使用 php 和 JavaScript。我想从博客中删除帖子和评论。网址是http://www.somewhereinblog.net

我想做的是 1.我想用软件登录 2.然后下载html 3.然后用正则表达式,xpath随便什么,把帖子和评论的内容分开

我一直在寻找。了解的很少。虽然我很确定我需要使用“htmlagilitypack”。我不知道如何将库添加到 C# 控制台或表单应用程序。有人可以帮我吗?我非常需要这个。我对 C# 的了解还不够一周。所以,如果有一些详细的信息,将不胜感激。热切期待。

先谢谢兄弟们

最佳答案

  1. 使用Webclient您可以登录并下载
  2. 我喜欢 html-agility-pack CsQuery因为允许您在 C# 代码中的字符串中使用 jQuery 语法,所以您可以将 html 下载到字符串中,然后在其中搜索和执行操作,就像使用 jQuery 和 HTML 页面一样。

关于C# 从网站抓取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12524737/

相关文章:

c# - 一起使用 InProc 和 Azure AppFabric 缓存

c# - 是否可以使用 Json.Net 以不同的方式序列化对象并反序列化它?

c# - 用波浪动画填充椭圆

c# - 如何使用 C# 从 XML 中删除重复属性

c# - 如何在 ASP.NET MVC 应用程序的 Razor 引擎中使用 Html.Displar 呈现 ModelMetadata 对象?

c# - 动态组合算法

c# - 测试 HtmlAgility Pack 创建的 HTML 是否有效

c# - 使用 HtmlAgilityPack 解析 dl

C# Html Agility Pack dd和dt标签解析问题

c# - HtmlAgilityPack 的替代品?