xml - 搜索或索引 XML 文件

标签 xml full-text-search scalability

我在一家新闻网站工作,该网站将所有报道都存储为 XML。我知道,这不是最好的方法,但它就是这样。我想做的是使从网站上搜索 XML 文件成为可能。现在我们的搜索功能完全由 Google 提供支持(它只搜索 Google 已经抓取的内容)。

我马上想到的是使用 Grep,这种方法工作正常,但可能不会横向扩展太多。另一种方法会花费更多的工作,但效果会更好,那就是将部分 XML 存储在关系数据库中。

考虑到我们后端的设置方式,迁移到不同的存储模型需要很长时间,所以目前,这是我们必须处理的。想法?

最佳答案

添加一些缓存可能有助于扩展 grep 的想法。但是,您可能会考虑一种解决方案,它不仅可以帮助解决今天的问题,还可以让您在明天更接近更好的解决方案。也许设计一个更好的解决方案并随着时间的推移逐步实现它会成功。

关于xml - 搜索或索引 XML 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14483658/

相关文章:

xml - 从 xsd 生成 xml

java - fx :id and id: in JavaFX? 和有什么区别

c# - 停止线程直到有足够的内存可用

mysql - 导轨 : searching with pseudo-relevancy

c# - 使用 .net api 的电子商务网站的开源多面搜索/引导导航

postgresql - postgresql 精确单词全文搜索

database - 万维网最大的网站运行在哪些数据库上?

sql - 可扩展的 MySQL 数据库,用于类似邮件的消息传递

javascript - 简单的 JavaScript XPath 语法模式验证器(无上下文)?

mysql - 独特的电子邮件查找方法