我想使用 Solr 作为已发布 Tridion 内容的客户端搜索引擎。它可能会作为与主应用程序断开连接的 RESTful 服务来完成。
由于我们几乎肯定会使用样板 DD4T,其中所有内容都发布到 Broker,我有一些担忧,尤其是在索引二进制文件(例如 PDF 或 Word 文件)时 - 听起来数据库可能会承受很大的压力?
推荐使用什么策略来检索二进制文件并以这种方式对其进行索引?听起来这比我们在 DB 外部有二进制项要困难得多?
最佳答案
我们已经决定将二进制文件发布到文件系统 - 您只需在 cd_storage_conf.xml 中配置如下:
<Publication Id="9" defaultStorageId="defaultdb" cached="true">
<Item typeMapping="Binary" storageId="defaultFile" cached="true"/>
</Publication>
但是,即使您确实选择将二进制文件发布到数据库,这也不应影响您的 Solr 索引,该索引将完全独立于代理数据库。您将需要编写一些自定义的东西(Custom Deployer?)将您的数据推送到您的 Solr 索引中,并且您可以为此选择忽略二进制文件。
关于solr - 将 Solr 与 'boilerplate' DD4T 一起使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15341295/