python - Pony ORM - 按特定顺序排序

标签 python sorting lambda ponyorm

执行 Pony ORM 查询并尝试按模型上存在的三个属性对查询进行排序。首先是歌曲类型,它可以是 ssf_type_order_map 中列出的五个值之一,然后是持续时间 (int) 和 uuid (string)。

对于歌曲类型,我希望按以下顺序对歌曲进行排序:Full、Full(Instrumental)、Shorts、Loops、Stems

如果我尝试使用以下 .order_by() 调用进行排序,它不会返回任何错误,但不会按我需要的类型按上述顺序排序(持续时间不过 UUID 排序工作正常)。

song_source_files = self.song_source_files.select(lambda ssf: True).order_by(lambda ssf: (ssf.type, ssf.duration, ssf.uuid))

这就是我认为的理想查询,将字符串类型映射到对其排序进行排序的映射。

ssf_type_order_map = {
    'Full': 1,
    'Full (Instrumental)': 2,
    'Shorts': 3,
    'Loops': 4,
    'Stems': 5
}

song_source_files = self.song_source_files.select(lambda ssf: True).order_by(lambda ssf: (ssf_type_order_map[ssf.type], ssf.duration, ssf.uuid))

但是在运行“表达式 ssf_type_order_map 具有不支持的类型‘dict’”时出现错误。

Order_by 上的 Pony ORM 文档 here , 对在这种情况下使用 lambda 非常含糊。

更新 - 9 月 7 日

我还尝试在模型上添加以下 getter 属性,如下所示:

@property
def source_type(self):
  ssf_type_order_map = {
    'Full': 1,
    'Full (Instrumental)': 2,
    'Shorts': 3,
    'Loops': 4,
    'Stems': 5
  }

  return ssy_type_order_map[self.type]

然后我尝试按如下方式对查询进行排序:

song_source_files = self.song_source_files.select(lambda ssf: True).order_by(lambda ssf: (ssf_type_order_map[ssf.type], ssf.duration, ssf.uuid))

但是我收到一个错误,基本上是说模型没有这个属性。基于 Django 的 ORM 的类似问题,我的假设是您只能访问数据库模型中存在的属性。

如果 Pony 也是这种情况,那么如何完成我想完成的事情呢?

最佳答案

首先我想说Pony区分了两种子表达式:外部表达式和关联表达式。外部表达式不依赖于生成器循环变量的值,而相关表达式则依赖。考虑以下示例:

from some_module import f, g

x = 100
query = select(e for e in MyEntity if e.attr > f(x, 200) and g(x, e))

在这个查询中我们有两个子表达式:第一个是f(x, 200),第二个是g(x, e)。前者被 Pony 认为是外部表达式,因为它不使用任何循环变量。在那种情况下,Pony 假设可以在查询执行之前用 Python 计算表达式的值,然后将表达式转换为单个参数。对于这样的表达式,Pony 不会对可以在其中使用哪些 Python 函数施加任何限制,因为这样的表达式的结果只是在 Python 中计算的单个值。

第二个表达式 g(x, e) 不能在 Python 中求值,因为它取决于循环变量 e 的值。对于不同的表行,这种表达式的结果可能不同。因此,Pony 需要将这些表达式翻译成 SQL。不是每个 Python 表达式都可以翻译成 SQL,g 需要是 Pony 专门知道如何翻译的函数。 Pony 定义了一个可以翻译的 Python 操作的子集。该子集包括数值类型的算术运算,startswithendswithin等字符串方法,以及等聚合函数>summax

在你的代码中,当你写的时候

.order_by(lambda ssf: (ssf_type_order_map[ssf.type], ssf.duration, ssf.uuid))

表达式ssf_type_order_map[ssf.type]引用对象变量ssf,因此每个表行会有不同的值,所以这是相关表达式和Pony需要将该表达式翻译成 SQL。目前 Pony 不明白如何执行这种特定的翻译,但原则上这是可行的。翻译结果将是如下 SQL CASE 语句:

ORDER BY CASE ssf.type
    WHEN 'Full' THEN 1
    WHEN 'Full (Instrumental)' THEN 2
    WHEN 'Shorts' THEN 3
    WHEN 'Loops' THEN 4
    WHEN 'Stems' THEN 5
    ELSE 0
END

好消息是您可以使用 Python if 表达式语法在 Pony 中编写这样的表达式:

(1 if ssf.type == 'Full' else
 2 if ssf.type == 'Full (Instrumental)' else
 3 if ssf.type == 'Shorts' else
 4 if ssf.type == 'Loops' else
 5 if ssf.type == 'Stems' else 0)

目前 Pony 还不支持反编译 if 表达式,所以如果你试图直接写这样的代码,你会得到一个异常。作为解决方法,您需要将 lambda 函数的源作为字符串传递。在这种情况下它会被翻译得恰到好处,因为我们可以直接将字符串解析为 AST 而无需反编译。所以你可以这样写:

song_source_files = self.song_source_files.select().order_by("""
    lambda ssf: ((1 if ssf.type == 'Full' else
                  2 if ssf.type == 'Full (Instrumental)' else
                  3 if ssf.type == 'Shorts' else
                  4 if ssf.type == 'Loops' else
                  5 if ssf.type == 'Stems' else 0),
                 ssf.duration, ssf.uuid)
""")

这应该可以完美地工作,但我建议以另一种方式解决这个问题:我们可以使用 namecode< 的 SourceFileType 实体 属性,然后按 ssf.type.code 值对 ssf 记录进行排序:

class SongSourceFile(db.Entity):
    name = Required(str)
    type = Required(lambda: SourceFileType)
    duration = Required(timedelta)
    uuid = Required(uuid.UUID, unique=True, default=uuid.uuid4)

class SourceFileType(db.Entity):
    name = Required(str)
    code = Required(int)
    files = Set(lambda: SongSourceFile)

然后可以按以下方式编写查询:

song_source_files = self.song_source_files.select().order_by(
    lambda ssf: (ssf.type.code, ssf.duration, ssf.uuid)
)

我认为这种方法更通用,因为现在除了namecode之外,您还可以向SourceFileType添加其他有用的属性,并在也有疑问。

关于python - Pony ORM - 按特定顺序排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39355048/

相关文章:

python - 如何获取 pygments 格式化程序的 css?

javascript - 按单元格而不是按行保存 # : IPython %save magic: Is there a way?

python - ListView 中的 Django 表单,表单 POST 时出错

c++ - 如何确保 lambda 的自动参数类型相同?

java - Java 8 中使用非静态方法的 lambda

python - 如何将列表复制一定次数

python - 保持对象按多个键排序的高效数据结构

algorithm - 为什么合并排序最多有 6 n log n 数组访问?

python - 按相似性对行和列进行排序的算法

python - 如何用多行编写 python lambda?