标题可能有点误导,但我想不出更好的标题。我正在编写一个简单的搜索引擎,它将在多个站点上搜索特定域。具体来说:我正在为硬式生活集/后电影/轨道编写一个搜索引擎。为此,我将在提供直播、轨道等的网站上进行搜索。这里的问题是速度,我需要将搜索查询传递给 5-7 个站点,获取结果,然后使用我自己的算法按排序顺序显示结果。我可以“多线程”它,但说起来容易做起来难,所以我有几个问题。
谢谢,
威廉·范·多恩
最佳答案
除非您正在尝试学习多线程,否则请避免自己为此编写基础结构。同步许多可能需要不同时间的任务,处理失败等,这是一团糟。
对于大部分可并行化的任务(例如查询多个站点、组合结果等),您可能需要查看现有基础架构。
Map/Reduce 框架(例如 Hadoop for Java)可以为您处理其中的一些问题,让您专注于应用程序的逻辑。
关于multithreading - 编写搜索引擎,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3070502/