python - 如何按数字拆分列表列表?

标签 python regex list

my_list = ['Rob Kardashian 00052369 1987-03-17 Reality Star',
'Brooke Barry 00213658 2001-03-30 TikTok Star',
'Bae De Leon 00896351 1997-08-02 Volleyball Player',
'Jonas Blue 02369785 1990-08-02 Music Producer']

我有一个人名、ID、DOB 和职业的列表。我想按姓名、ID、DOB 和他们的职业拆分每个人。

我尝试了一些愚蠢的方法,但只能完成部分工作,我想知道是否有更好的解决方案?

下面是我的代码:

import re 

def remove(my_list): 
    pattern = '[0-9]'
    my_list = [re.sub(pattern, '', i) for i in my_list] 
    return my_list

print(remove(my_list))

但是数字不见了 ['Rob Kardashian -- 真人秀明星'、'Brooke Barry -- TikTok 明星'、'Bae De Leon -- Volley 运动员'、'Jonas Blue -- 音乐制作人']

然后,我删除了'--'

[s.replace(' -- ',' ') for s in remove(my_list)]

['Rob Kardashian  Reality Star','Brooke Barry  TikTok Star','Bae De Leon  Volleyball Player','Jonas Blue  Music Producer']

我的预期输出是一个数据框:

enter image description here

pd.DataFrame(my_list)

感谢您的帮助。

最佳答案

您可以使用 re.split :

import re
my_list = ['Rob Kardashian 00052369 1987-03-17 Reality Star', 'Brooke Barry 00213658 2001-03-30 TikTok Star', 'Bae De Leon 00896351 1997-08-02 Volleyball Player','Jonas Blue 02369785 1990-08-02 Music Producer']
new_l = [re.split('\s(?=\d)|(?<=\d)\s', i) for i in my_list]

输出:

[['Rob Kardashian', '00052369', '1987-03-17', 'Reality Star'], 
 ['Brooke Barry', '00213658', '2001-03-30', 'TikTok Star'], 
 ['Bae De Leon', '00896351', '1997-08-02', 'Volleyball Player'], 
 ['Jonas Blue', '02369785', '1990-08-02', 'Music Producer']]

正则解释:

\s(?=\d) : 匹配空格后跟数字的任何实例。

| (交替):尝试匹配其左侧的每个表达式或右侧的每个表达式,一旦找到有效匹配就停止。

(?<=\d)\s : 匹配以数字开头的空格的任何实例。

关于python - 如何按数字拆分列表列表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56979262/

相关文章:

c# - 用于匹配前缀为 "global::"的完全限定 C# 类型名称的正则表达式

python - 嵌套的 Python 列表理解

javascript - 正则表达式匹配卡代码输入

list - 如何操作由列表组成的复杂数据结构?

c# - 拆分字符串值并存储在列表中

python - 我应该如何在Python中使用自定义方法发送HTTP请求

python - Pandas :无法检测两列中的重复项

python - Pandas Groupby 仅相同 ID 且列值为 false 时

python - 如何读取使用cli设置的fabric环境变量

regex - 在 Vim 中忽略部分搜索模式中的大小写