java - 投影后进行组聚合时引用无效

标签 java spring-data spring-data-mongodb

此示例聚合将抛出 IllegalArgumentException 无效引用“角色”!

每次在投影阶段后重命名字段后,我们都会遇到这个问题。

    final Aggregation aggregation = newAggregation(

            // We only like to have the "company" and "empolyee.role" renamed to "role"
            project("company")
                    .and("employee.role").as("role"),

            // Group by the **renamed** "role"
            group("role").count().as("count"), // this will fail because "role" is an invalid reference.
            limit(2)
            );

    return aggregation;

我们正在处理的 JSON 如下所示:

{
    // some fields
    company : {
          // some fields
    }

    employee : {
           role : {
                    // some fields
           }

    } 
}

想法:

Here奥利弗说

It's important to understand that you define aggregations in terms of type properties, not document field names.

这就是我们得到异常的原因吗?如果是这样,如何使用漂亮的聚合 api spring 数据提供。

更新::

这是我在 1.5.0.M1 版本中获得的 Stacktrace:

java.lang.IllegalArgumentException: Invalid reference 'role'!
    at org.springframework.data.mongodb.core.aggregation.ExposedFieldsAggregationOperationContext.getReference(ExposedFieldsAggregationOperationContext.java:78)
    at org.springframework.data.mongodb.core.aggregation.ExposedFieldsAggregationOperationContext.getReference(ExposedFieldsAggregationOperationContext.java:62)
    at org.springframework.data.mongodb.core.aggregation.GroupOperation.toDBObject(GroupOperation.java:292)
    at org.springframework.data.mongodb.core.aggregation.Aggregation.toDbObject(Aggregation.java:247)
    at com.xxx.report.adapter.AggrigateByTopic.aggrigateBy(AggrigateByTopic.java:38)
    at com.xxx.report.adapter.AggrigateByTopicTest.shouldAggrigate(AggrigateByTopicTest.java:38)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:606)
    at org.junit.runners.model.FrameworkMethod$1.runReflectiveCall(FrameworkMethod.java:47)
    at org.junit.internal.runners.model.ReflectiveCallable.run(ReflectiveCallable.java:12)
    at org.junit.runners.model.FrameworkMethod.invokeExplosively(FrameworkMethod.java:44)
    at org.junit.internal.runners.statements.InvokeMethod.evaluate(InvokeMethod.java:17)
    at org.junit.internal.runners.statements.RunBefores.evaluate(RunBefores.java:26)
    at org.springframework.test.context.junit4.statements.RunBeforeTestMethodCallbacks.evaluate(RunBeforeTestMethodCallbacks.java:74)
    at org.springframework.test.context.junit4.statements.RunAfterTestMethodCallbacks.evaluate(RunAfterTestMethodCallbacks.java:83)
    at org.springframework.test.context.junit4.statements.SpringRepeat.evaluate(SpringRepeat.java:72)
    at org.springframework.test.context.junit4.SpringJUnit4ClassRunner.runChild(SpringJUnit4ClassRunner.java:232)
    at org.springframework.test.context.junit4.SpringJUnit4ClassRunner.runChild(SpringJUnit4ClassRunner.java:89)
    at org.junit.runners.ParentRunner$3.run(ParentRunner.java:238)
    at org.junit.runners.ParentRunner$1.schedule(ParentRunner.java:63)
    at org.junit.runners.ParentRunner.runChildren(ParentRunner.java:236)
    at org.junit.runners.ParentRunner.access$000(ParentRunner.java:53)
    at org.junit.runners.ParentRunner$2.evaluate(ParentRunner.java:229)
    at org.springframework.test.context.junit4.statements.RunBeforeTestClassCallbacks.evaluate(RunBeforeTestClassCallbacks.java:61)
    at org.springframework.test.context.junit4.statements.RunAfterTestClassCallbacks.evaluate(RunAfterTestClassCallbacks.java:71)
    at org.junit.runners.ParentRunner.run(ParentRunner.java:309)
    at org.springframework.test.context.junit4.SpringJUnit4ClassRunner.run(SpringJUnit4ClassRunner.java:175)
    at org.eclipse.jdt.internal.junit4.runner.JUnit4TestReference.run(JUnit4TestReference.java:50)
    at org.eclipse.jdt.internal.junit.runner.TestExecution.run(TestExecution.java:38)
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.runTests(RemoteTestRunner.java:467)
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.runTests(RemoteTestRunner.java:683)
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.run(RemoteTestRunner.java:390)
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.main(RemoteTestRunner.java:197)

最佳答案

确实,实现“不喜欢”您在此处使用的字段别名类型,但在最严格的解释中,您所做的没有多大意义。

你的陈述应该是这样的:

    final Aggregation aggregation = newAggregation(
          group("employee.role").count().as("count"),
          sort(Sort.Direction.DESC,"count"),
          limit(2)
    );

    System.out.println(aggregation);

产生管道为:

{ 
    "aggregate" : "__collection__", 
    "pipeline" : [ 
        { "$group" : { 
            "_id" : "$employee.role", 
            "count" : { "$sum" : 1}
        }}, 
        { "$sort" : { "count" : -1} },
        { "$limit" : 2}
    ]
}

重点是您的 $project 在这里的用法实际上并没有做任何事情,除了选择一个您以后不使用的字段,并为另一个字段创建别名您实际上并没有真正使用的字段,因为它只是成为您分组的 _id 字段。还要注意 $sort 的使用,因为它对 $limit 没有多大意义,除非你有事情按预期的顺序进行,$group 本身不会这样做。

至于解释“属性”的概念,我不是很喜欢,那么你可以考虑下面的代码:

    final Aggregation aggregation = newAggregation(
          group("country","employee.role").count().as("count"),
          group("employee.role","count").count().as("totalCount"),
          sort(Sort.Direction.DESC,"totalCount"),
          limit(2)
    );

    System.out.println(aggregation);

然后构建的管道将如下所示:

{ 
    "aggregate" : "__collection__", 
    "pipeline" : [ 
        { "$group" : { 
            "_id" : { 
                "country" : "$country" , 
                "role" : "$employee.role"
            },
            "count" : { "$sum" : 1}
        }}, 
        { "$group" : { 
            "_id" : { 
                "role" : "$_id.employee.role" ,
                "count" : "$count"
            }, 
            "totalCount" : { "$sum" : 1}
        }}, 
        { "$sort" : { "totalCount" : -1} }, 
        { "$limit" : 2 }
    ]
}

因此,虽然这将无一异常(exception)地运行到输出转储,但生成的管道中仍然存在问题。虽然第一个 $group 语句压缩了子文档字段的别名,如果此时一切正常,它是第二个 $group 引入问题的阶段。

除非您通过完整的“employee.role”表示法将该字段作为原始文档的属性引用,否则构建器方法只是“不开心”。虽然它确实解决了这现在将成为前一阶段的 _id 字段的一部分,但它完全忘记了该字段是别名的。

对于我的两分钱,这是错误的行为,也是我不喜欢构建器的一个重要原因。

所以你可以使用它们,但我认为设计还不完全,还有一些缺陷。同样,为了我的钱,只使用 DBObject 类型来构建管道并完成它似乎更安全、更灵活。至少你知道你总能准确理解你的意思。

关于java - 投影后进行组聚合时引用无效,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23372114/

相关文章:

spring - 使用 Spring Data Mongo 配置多个 MongoDB 存储库

java - 为什么 Spring Data JPA 保存方法没有立即验证?

mongodb - 如何更新数组中与 spring 数据中的条件匹配的嵌套对象 - mongodb?

spring - 使用 Spring Boot 的数据库事件监听器

full-text-search - Spring Data mongo不区分大小写像查询

java - XPath 表达式语法验证

java - Log4j 未从资源文件夹中获取 log4j.properties 文件

java - DataMatrix 支持 UTF8 或 ISO-8859-2 吗?

java - 从 Java 向 Google Assistant 发送请求

java - Spring Data Jpa 保存测试失败