我有一个 CSV 文件,其中包含一列,其值以 SI 比例给出 因素。我需要对该列进行数字排序。具体来说,CSV 文件包含著名天文物体(Messier 物体)的列表,我需要按距离对它们进行排序。问题是距离是用使用 SI unix 前缀的数字给出的,所以简单的排序是行不通的。有没有一种简单的方法可以做到这一点?
这是该文件的一个非常精简的版本:
"Messier Number","Distance"
"M1","6.5 kly"
"M2","33 kly"
"M7","980 ly"
"M16","7 kly"
"M19","29 kly"
"M31","2.5 Mly"
"M49","56 Mly"
这是我目前所拥有的::
from csv import DictReader
with open('m.csv') as f:
messier = sorted(DictReader(f), key=lambda e: e['Distance'])
for entry in messier:
print('{Messier Number:>5s} {Distance}'.format(**entry))
但是这是按字母排序而不是数字排序:
M31 2.5 Mly
M19 29 kly
M2 33 kly
M49 56 Mly
M1 6.5 kly
M16 7 kly
M7 980 ly
我可以尝试分开距离并自己解释 k 和 M,但是 这似乎是错误的方法。毕竟,使用公制前缀非常 常见的。必须已经有一些对此的支持。任何指针都是 非常感谢。
最佳答案
最简单的方法是使用 QuantiPhy .这是一个不错的包 用 SI 比例因子和单位读取和写入数字。量子物理 privides Quantity,其子类 float 。它将您的字符串转换为 一些行为类似于 float 的东西,它允许你进行数字排序。这 字符串可能包括 SI 比例因子和单位。比例因子适当 解释。在这种情况下,不需要这些单位,因此可以有效地 忽略。
将您的代码修改为以下内容应该可以。
from csv import DictReader
from quantiphy import Quantity
with open('m.csv') as f:
messier = sorted(DictReader(f), key=lambda e: Quantity(e['Distance']))
for entry in messier:
print('{Messier Number:>5s} {Distance}'.format(**entry))
使用这段代码,排序是正确的:
M7 980 ly
M1 6.5 kly
M16 7 kly
M19 29 kly
M2 33 kly
M31 2.5 Mly
M49 56 Mly
关于python - 使用 SI 比例因子对数字进行排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45159696/