c# - 从代码进行外部网站搜索

标签 c# .net database search

我有一个包含姓氏、名字和邮政编码的 csv 文件。我想写一个 .NET 程序自动在 www.canada411.com 上搜索此人的邮政编码和姓氏,并将所有结果记录在数据库中。

我不知道该怎么做,但这些是我需要做的步骤:

  1. 阅读文件(我能做到)
  2. 使用文件中的信息搜索 www.canada411.com(不知道该怎么做)
  3. 识别页面的结果部分(不知道该怎么做)
  4. 对于搜索的每个结果,读取结果(不知道如何做)并存储在数据库中(我可以做最后一点)。

你能帮我指明正确的方向吗?非常感谢

最佳答案

您指的是屏幕抓取,这是一种将网页结果解析为有意义信息的高度不可靠的方法。

您最好找到一个“后代码查找服务”,该服务公开一个 API 用于以编程方式检索此信息。这样您的代码就不会因为提供商更改其网页设计而中断。

但是,要实现您的要求,您可以使用 WebClient 或构造一个 HttpWebRequest。然后,您可以解析响应以找到您感兴趣的 html 区域。

使用 HttpWebRequest 的示例 - http://wiki.asp.net/page.aspx/285/httpwebrequest/
解析 html 的最佳工具 - http://htmlagilitypack.codeplex.com/

关于c# - 从代码进行外部网站搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6511625/

相关文章:

c# - 在 MVC 中使用 HTML 按钮

.net - 如何在 vb.net 中闪烁/闪烁任务栏图标?

mysql无法显示解释数据

mysql - 数据库中所有表的字段总数

c# - 枢轴重叠 WP 8.1 通用应用程序中的其他元素(并自动更改边距)

database - 带有 OCaml 的 SQLite

c# - 加密程序集 [c#]

c# - 如何在保持其大小的同时自动将 WPF 窗口捕捉到屏幕边缘?

c# - C# 中 OAuth 随机数的线程安全随机数/字符串生成器

c# - 不同的文本渲染方法不会产生我想要的