java - Jooq/SQL 查找另一列中唯一值的平均值

标签 java mysql sql jooq

我有一个查询要从表组合中返回各种数字。我正在使用 jooq 来运行此查询。

final SiteSalesFigures siteSalesFigures =
dsl.select(
      countDistinct(LINE.TRANSACTION_ID).as("transactionCount"),
      sum(LINE.PROFIT).as("totalProfit"),
      sum(LINE.TOTAL).as("totalSalesAmount"),
      sum(LINE.QUANTITY).as("totalItemsSold"),
      sum(LINE.PROFIT).divide(sum(LINE.TOTAL)).multiply(100).as("profitMarginPercentage"),
      avg(TRANSACTIONS.NO_OF_ITEMS).as("averageItemsPerTransaction"),
      sum(LINE.TOTAL).divide(countDistinct(LINE.TRANSACTION_ID)).as("averageSalesTotalPerTransaction"),
      sum(LINE.PROFIT).divide(countDistinct(LINE.TRANSACTION_ID)).as("averageProfitTotalPerTransaction"))
    .from(TRANSACTIONS)
    .join(LINE).on(TRANSACTIONS.TRANSACTION_ID.equal(LINE.TRANSACTION_ID))
    .leftJoin(ITEM).on(LINE.ITEM_ID.equal(ITEM.ITEM_CODE))
    .where(TRANSACTIONS.SITE_ID.equal(siteId))
    .and(TRANSACTIONS.NO_OF_LINES.greaterThan(0))
    .and(TRANSACTIONS.START_TIME
      .between(new Timestamp(reportStartDate.toInstant().toEpochMilli()))
      .and(new Timestamp(reportEndDate.toInstant().toEpochMilli())))
    .and(TRANSACTIONS.TRANSACTION_TYPE_ID.notEqual(cancelledSaleID))
    .fetchOneInto(SiteSalesFigures.class);

事实证明,averageItemsPerTransaction 是问题所在。我完全理解为什么它不起作用,但我不确定如何让它起作用。不幸的是,由于使用行表的排除,连接是必要的。

如果一笔交易有 3 行,则交易详细信息(包括 no_of_items)会被复制 3 次,从而导致值不正确。

我知道正确的值,因为我只在交易表上运行了平均(no_of_items)查询。

以下是仅两个事务的表的样子(本示例不需要隐藏列):

          **transaction_id**       **no_of_lines    no_of_items**
8abf1720-51f6-a1bf-4714-004b644cb99f --- 2         --- 2
8abf1720-51f6-a1bf-4714-004b644cb99f --- 2         --- 2
d239feab-38ea-7c8a-4814-7d5a38f74949 --- 3         --- 4
d239feab-38ea-7c8a-4814-7d5a38f74949 --- 3         --- 4
d239feab-38ea-7c8a-4814-7d5a38f74949 --- 3         --- 4

您会注意到行数并不总是等于项目数(例如,一行可以将一个项目扫描两次)

有人有解决办法吗?

最佳答案

使用 2 个查询的解决方案

一个明显的解决方案是运行两个查询来获取这些结果。第一个查询将是您已有的查询(但没有平均值),第二个查询将仅计算平均值:

final SiteSalesFigures siteSalesFigures =
dsl.select(
      avg(TRANSACTIONS.NO_OF_ITEMS).as("averageSalesTotalPerTransaction"),
      avg(TRANSACTIONS.PRICE).as("averageSalesTotalPerTransaction"),
      avg(TRANSACTIONS.PROFIT).as("averageProfitTotalPerTransaction"))
    .from(TRANSACTIONS)
    .where(TRANSACTIONS.SITE_ID.equal(siteId))
    .and(TRANSACTIONS.NO_OF_LINES.greaterThan(0))
    .and(TRANSACTIONS.START_TIME
      .between(new Timestamp(reportStartDate.toInstant().toEpochMilli()))
      .and(new Timestamp(reportEndDate.toInstant().toEpochMilli())))
    .and(TRANSACTIONS.TRANSACTION_TYPE_ID.notEqual(cancelledSaleID))
    .fetchOneInto(SiteSalesFigures.class);

这可能比一次性完成所有操作要慢得多,具体取决于 TRANSACTIONS 表的大小。

使用 weighted average 的解决方案

由于您的联接会产生重复的 TRANSACTIONS 行,因此您必须计算加权平均值,而不是普通平均值。给定您的示例,如果您的 TRANSACTIONS 行重复 3 次,那么您必须将该特定事务的贡献除以 3。这通常会非常复杂,但考虑到您已经通过以下方式对模式进行了非规范化预先计算每笔交易的 NO_OF_ITEMS,您很幸运。如果您没有此列,则必须在派生表中预先计算它。

在 SQL/jOOQ 中:

final SiteSalesFigures siteSalesFigures =
dsl.select(
      ...
      count() 
        .divide(countDistinct(TRANSACTIONS.TRANSACTION_ID)).as("averageSalesTotalPerTransaction"),
      sum(TRANSACTIONS.PRICE.divide(TRANSACTIONS.NO_OF_ITEMS))
        .divide(countDistinct(TRANSACTIONS.TRANSACTION_ID)).as("averageSalesTotalPerTransaction"),
      sum(TRANSACTIONS.PROFIT.divide(TRANSACTIONS.NO_OF_ITEMS))
        .divide(countDistinct(TRANSACTIONS.TRANSACTION_ID)).as("averageProfitTotalPerTransaction"))
    .from(TRANSACTIONS)
    .join(...)
    ...
    .fetchOneInto(SiteSalesFigures.class);

根据您的数据类型,您可能需要转换为 DOUBLENUMBER

I've blogged about calculating weighted averages in SQL more in detail here .

关于java - Jooq/SQL 查找另一列中唯一值的平均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55167003/

相关文章:

sql - 使 SQL 查询更高效

java - 优化java程序中trie结构的空间使用

java - Log4j2 rc 1 DefaultRolloverStrategy 在 7 个文件后覆盖

java - 无法找到命名参数 Hibernate

mysql - JSP 上的谷歌地图与 Mysql 数据库进行坐标

sql - 1 对多关系限制 1 对 3 的数据库设计效率

java - Maven/Eclipse : Could not find any META-INF/persistence. 类路径中的 xml 文件

mysql - 如何在 MYSQL 中删除 2 行中的 1 行?

php - MySQL float 被意外舍入

sql - 根据相关表中的最新值获取表中的条目