javascript - JS中的蜘蛛爬行框架

标签 javascript c# web-crawler

这不会是一个严格的技术编程问题。我正在寻求更多建议,希望你们能提供帮助。

我正在寻找一个网络框架/蜘蛛,它可以抓取我指向的不规则网站(没有易于定义的页面结构的网站,例如使用网址中的标题字符串进行索引)并搜索关键字。可以轻松定制的东西,我可以轻松地用 JS(最好)或 C# 编写附加功能

我对网络爬虫行业很陌生,所以只要给我一个框架,我就很乐意自己阅读它。谢谢:)

最佳答案

对我来说,最好的 C# 网络爬虫仍然是 Abot https://code.google.com/p/abot/它易于学习并且可以扩展。

关于javascript - JS中的蜘蛛爬行框架,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28537906/

相关文章:

javascript - 使用 javascript 滑动 html 部分的最佳方法是什么?

javascript - 为什么我的 slider 脚本中有些元素未定义?

javascript - 打开 Bootstrap 模式弹出窗口时防止加载其他类

c# - 如何在设计时将图像设置为窗口窗体中的超链接

c# - 仅使用 paypal asp.net SDK 进行信用卡处理

c# - WCF 客户端 - 最佳实践

apache - 我可以阻止 Apache Web 服务器上每个站点的搜索爬虫吗?

javascript - 如何在不使用 ng serve 的情况下为 Angular 5 应用程序提供服务?

python - python 中的网络爬虫。我应该从哪里开始,我应该遵循什么? - 需要帮助

python - 使用 Scopus API 从 Scopus 获取作者的文章(AUTHENTICATION_ERROR)