c# - 如何让 C# 中的应用程序从网站收集数据?

标签 c# database web-scraping

首先,希望我的问题没有打扰到您。我真的需要了解如何实现这一点,但不幸的是,我真的是一个初学者,在编程方面我正在爬行。我正在努力以最好的方式学习它。我感谢你给我的任何帮助。

任务如下:我奉命寻找一种方法,使用 C# 应用程序从网站收集一些数据。这将每天进行,以更新我们将用于计算某些财务指标的数据。

我知道我的问题可能听起来很模糊,无论如何,即使告诉我如何更精确也会对我有所帮助。我知道我似乎很绝望,但抛开所有人事问题不谈,我的奖学金有点依赖于此。

提前致谢! (请不要介意英语不好,我是巴西人,我的英语可能还没有那么好。)

最佳答案

首先,你的英语很好。事实上,除非你另有说明,否则我一直以为你是母语人士。

您要查找的术语是“网站抓取”。观察这个问题:Options for HTML scraping? .第二个答案指向您可以使用的 HTML 敏捷包库。

现在,这里有两种可能性。首先是您必须解析 HTML 并从中抓取数据。这需要更多的计算,并且取决于页面的布局。如果他们改变网站的外观,它可能会破坏爬虫。

第二种可能性是它们提供一些您可以使用的 XML 或 JSON 网络服务。在这种情况下,您不是在抓取任何内容,而是在使用真实的数据提要。如果站点的布局发生变化,您也不会中断。您的目标网站是否支持这种形式的数据提要取决于网站。

关于c# - 如何让 C# 中的应用程序从网站收集数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4785623/

相关文章:

php - 我应该如何在远程服务器上设置数据库?

c# - Entity Framework Core-使用表达式树并以接口(interface)作为参数

c# - 是否可以为 .NET 中的类定义别名?

mysql - 存储 OAuth token 的最佳数据长度

sql-server - 如何在 SQL Server 中创建是/否 boolean 字段?

javascript - 使用 javascript/jquery 选择仅跟随某些元素的文本

python - 使用 Python 和 BeautifulSoup 的 Webscrape - 错误消息不确定如何修复

c# - 如何使贝塞尔曲线的单个 anchor 连续或不连续

c# - 当当前列在gridview中有很多元素时自动拉伸(stretch)相邻列的大小

Python 通过 xml 抓取打印空括号