我有一个包含姓氏、名字和邮政编码的 csv 文件。我想写一个 .NET 程序自动在 www.canada411.com 上搜索此人的邮政编码和姓氏,并将所有结果记录在数据库中。
我不知道该怎么做,但这些是我需要做的步骤:
- 阅读文件(我能做到)
- 使用文件中的信息搜索 www.canada411.com(不知道该怎么做)
- 识别页面的结果部分(不知道该怎么做)
- 对于搜索的每个结果,读取结果(不知道如何做)并存储在数据库中(我可以做最后一点)。
你能帮我指明正确的方向吗?非常感谢
最佳答案
您指的是屏幕抓取,这是一种将网页结果解析为有意义信息的高度不可靠的方法。
您最好找到一个“后代码查找服务”,该服务公开一个 API 用于以编程方式检索此信息。这样您的代码就不会因为提供商更改其网页设计而中断。
但是,要实现您的要求,您可以使用 WebClient 或构造一个 HttpWebRequest。然后,您可以解析响应以找到您感兴趣的 html 区域。
使用 HttpWebRequest 的示例 - http://wiki.asp.net/page.aspx/285/httpwebrequest/
解析 html 的最佳工具 - http://htmlagilitypack.codeplex.com/
关于c# - 从代码进行外部网站搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6511625/