我使用Solr的DIH从MySQL数据库导入数据。我的数据配置定义为:
<document>
<entity name="PARENT" query="SELECT * FROM PARENT">
<field name="id" column="id" />
<entity name="CHILD" child="true" query="SELECT * FROM CHILD WHERE id = ${PARENT.id}">
<field name="id" column="id" />
<field name="field1" column="field2" />
<field name="field1" column="field2" />
</entity>
</entity>
</document>
我必须在子文档中包含一个 id 字段,并在 schema.xml 中包含一个 root 字段。但是导入的文档并不像
{
id:1
{
field1:
field2:
field3:
}
},
{
id:2
{
field1:
field2:
field3:
}
}
,但就像
{
id:1
field1:
root:1
},
{
id:1
field2:
root:1
},
{
id:1
field3:
root:1
},
这是预期的结果吗?谁能告诉我使用 DIH 从 MySQL 导入嵌套实体的正确配置是什么?
最佳答案
有两点需要提及:
根据文档 here ,
请注意,“实体”元素可以嵌套,这允许实体 示例数据库中的关系将被镜像到这里,以便我们可以 生成非规范化的 Solr 记录,其中可能包含多个功能 对于一件商品
因此,尽管 xml 中的实体结构就像父子结构,但它表示 solr 在内部存储为非规范化的。这就是这里发生的事情
您是否获得了 child 的单独 ID?我可以看到,根在所有子文档中重复,这是预期的,但是 id(假设它是子 id)也是相同的,这很奇怪。您能确认一下吗?
在 solr 中添加文档时,使用嵌套概念,您总是会得到 1+n 个文档,其中 1 是父文档,n 是子文档
关于mysql - 带有数据导入处理程序的 Solr 子文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31777792/