我试图用 |INDEX|
和 /
分割字符串。
re.split
可以处理多个分隔符,并使用管道来分隔每个分隔符,因此需要对它们进行转义。
我尝试分离:
a = 'Tokenized/0003036v1|INDEX|3847.story.json'
re.split( r"/|\|INDEX|\|" , a)
但是,这导致了额外的空分割:
['Tokenized', '0003036v1', '', '3847.story.json']
为什么列表中有 4 个项目,而不是 3 个,其中有一个空项目?
最佳答案
您的正则表达式中有一个错误,在 |INDEX|
的结束 \|
之前有一个额外的 |
,因此该字符串是在 |INDEX
和 |
上拆分,导致它们之间出现空字符串。将正则表达式更改为:
re.split( r"/|\|INDEX\|" , a)
关于python - 在 re.split 中使用管道会导致发生额外的拆分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58254139/