c# - 编写一个扫描电子商务网站并从中提取产品图片+价格+描述的C#程序

标签 c# screen-scraping

我正在开发一个电子商务搜索引擎,允许您在许多电子商务网站中搜索产品。

我该如何处理此事?

我需要一个能够扫描网站、解析其 HTML 并确定网站中的哪些图像是产品图像、哪些是产品描述、哪些是产品价格的应用程序。

很高兴听到任何想法,例子。

提前致谢。

编辑: 我的问题不是如何从网站获取 HTML(称为屏幕抓取),而是更多关于如何解析该信息并了解哪些 html 包含我正在寻找的实际数据,哪些不是。

最佳答案

您可能会发现 this thread对你的追求有帮助。我在那里概述了基本步骤。这是在 SO 上标记为“Screen-scraping”的所有问题的链接。此外,网络上有很多 Material - Google .

关于c# - 编写一个扫描电子商务网站并从中提取产品图片+价格+描述的C#程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/519387/

相关文章:

c# - 无法从传输连接读取数据 - TFS 问题

c# - 使用枚举作为属性参数

javascript - IEnumerable<int> 数据集从 Controller 传递到 VIEW 并根据 View 页面上的值显示或隐藏 div 部分

c# - asp.net 网站中的静态字段问题

java - 使用Jsoup登录该页面失败

java - 如何执行网络抓取以在 Google App Engine 上查找 Java 中的特定链接页面?

html - 抓取网站并将其转换为 HTML?

c# - Asp.Net MVC LinkedIn OAuth 2.0 登录失败

python - 如何使用 python 从 GUI 可执行文件导出数据

jquery - 是什么阻止我使用 $.ajax 加载另一个域的 html?