我在一家新闻网站工作,该网站将所有报道都存储为 XML。我知道,这不是最好的方法,但它就是这样。我想做的是使从网站上搜索 XML 文件成为可能。现在我们的搜索功能完全由 Google 提供支持(它只搜索 Google 已经抓取的内容)。
我马上想到的是使用 Grep,这种方法工作正常,但可能不会横向扩展太多。另一种方法会花费更多的工作,但效果会更好,那就是将部分 XML 存储在关系数据库中。
考虑到我们后端的设置方式,迁移到不同的存储模型需要很长时间,所以目前,这是我们必须处理的。想法?
最佳答案
添加一些缓存可能有助于扩展 grep 的想法。但是,您可能会考虑一种解决方案,它不仅可以帮助解决今天的问题,还可以让您在明天更接近更好的解决方案。也许设计一个更好的解决方案并随着时间的推移逐步实现它会成功。
关于xml - 搜索或索引 XML 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14483658/