web-crawler - 旅游搜索引擎和聚合器如何获取源数据？

我正在为旅游搜索引擎考虑一些想法，我想知道这些网站是如何获取它们的源数据的。他们是否从航空公司主页上抓取了所有内容？考虑到航空公司等的数量，这似乎是一项艰巨的工作。

是否有每个航空公司也遵守的 API 或 Web 服务标准？

我是否必须为我希望索引的每家航空公司协商访问数据 API 的权限？

最佳答案

在欧洲，有一个名为 tradedoubler 的附属平台似乎通过 API 提供此类信息。

http://www.tradedoubler.com/index.html

关于web-crawler - 旅游搜索引擎和聚合器如何获取源数据？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1513799/

相关文章：

hadoop - 重新索引爬取的数据 Solr 5.4.1