algorithm - 自动获取术语列表，导入 Windows 搜索功能(针对内容)，并导出结果列表。 (自动？)

我的下一个重大挑战是编写一个脚本(我假设它会在 AutoIT 中，我在这个领域经验不足)来自动化 Windows 搜索功能。

最终目标是从 .txt 文件中获取搜索词列表(每行一个字符串)，并在计算机上的每个文档的内容中搜索所述搜索词(一次一个)。

我可以手动做到这一点 - 打开按内容搜索功能，索引所有附加驱动器上的所有文件，一个一个地搜索术语，并突出显示所有 > shift-click > Copy as path > paste in notepad,并另存为 [searchterm].txt。

但是，我需要使整个过程自动化。我知道我可能需要为将要使用的每个 Windows 版本(XP、Vista、7、8)编写一个单独的脚本。

这是一项很容易完成的任务，还是需要花费大量的编程时间？谁能指出我正确的方向？感谢所有帮助。

最佳答案

好吧，假设您的查询文本文件足够大，并且您不想为每个查询实际迭代整个文件系统，那么您正在描述一个经典的 information retrieval问题。

信息检索领域是一个广阔的研究领域，我真的不鼓励您尝试从头开始实现它。

我确实鼓励使用已经为您开发和测试过的内置库。例如，在 Java 中，一个流行的选择是 lucene - 广泛用于到处搜索。

如果你不熟悉 java，我也知道这个库的 python ( pylucene ) 和 .NET ( lucene.NET ) 绑定(bind)。

要了解有关信息检索的更多信息，我推荐 Manning 的 Introduction to Information Retrieval

关于algorithm - 自动获取术语列表，导入 Windows 搜索功能(针对内容)，并导出结果列表。 (自动？)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13954785/