python - 如何正确排序带有数字的字符串?

标签 python regex sorting string

我有一个包含数字的字符串列表,但我找不到对它们进行排序的好方法。
例如我得到这样的东西:

something1
something12
something17
something2
something25
something29

使用 sort() 方法。

我知道我可能需要以某种方式提取数字然后对列表进行排序,但我不知道如何以最简单的方式进行。

最佳答案

也许您正在寻找 human sorting (也称为 natural sorting):

import re

def atoi(text):
    return int(text) if text.isdigit() else text

def natural_keys(text):
    '''
    alist.sort(key=natural_keys) sorts in human order
    http://nedbatchelder.com/blog/200712/human_sorting.html
    (See Toothy's implementation in the comments)
    '''
    return [ atoi(c) for c in re.split(r'(\d+)', text) ]

alist=[
    "something1",
    "something12",
    "something17",
    "something2",
    "something25",
    "something29"]

alist.sort(key=natural_keys)
print(alist)

产量

['something1', 'something2', 'something12', 'something17', 'something25', 'something29']

PS。我已将答案更改为使用 Toothy 的自然排序实现(发表在评论 here 中),因为它比我原来的答案快得多。


如果您希望使用 float 对文本进行排序,则需要将正则表达式从匹配整数(即 (\d+))的正则表达式更改为 a regex that matches floats :

import re

def atof(text):
    try:
        retval = float(text)
    except ValueError:
        retval = text
    return retval

def natural_keys(text):
    '''
    alist.sort(key=natural_keys) sorts in human order
    http://nedbatchelder.com/blog/200712/human_sorting.html
    (See Toothy's implementation in the comments)
    float regex comes from https://stackoverflow.com/a/12643073/190597
    '''
    return [ atof(c) for c in re.split(r'[+-]?([0-9]+(?:[.][0-9]*)?|[.][0-9]+)', text) ]

alist=[
    "something1",
    "something2",
    "something1.0",
    "something1.25",
    "something1.105"]

alist.sort(key=natural_keys)
print(alist)

产量

['something1', 'something1.0', 'something1.105', 'something1.25', 'something2']

关于python - 如何正确排序带有数字的字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5967500/

相关文章:

python - 基于深色中心线用python水平分割图像

python - 值错误: x and y must be the same size when ploting predicted values

正则表达式。检查并填充字符串以确保使用特定的字符串格式

sorting - J 排序函数 : 1/:1 returns 0

python - 从另一个python文件调用一个python文件中的函数

python - 识别包含数字和字符串的 pandas 数据框列

javascript - 在不知道如何排除故障的情况下替换 c# 函数 bij Jquery 不工作

Java 正则表达式

java - 读取文本文件(使用ArrayList分隔、排序、查找之间的数字)

java - 使用字母数字值对 Java 中的自定义对象列表进行排序