我有一个包含 3 列的数据框:
id,name,team
101,kevin, marketing
102,scott,admin\n
103,peter,finance\n
我正在尝试应用正则表达式函数,以便删除不必要的空格。我已经得到了删除这些空格的代码,但是我无法在整个数据帧中循环它。
这是我迄今为止尝试过的:
df['team'] = re.sub(r'[\n\r]*','',df['team'])
但这会引发错误AttributeError:'Series'对象没有属性're'
有人可以建议我如何在整个 Dataframe df['team']
列中循环这个正则表达式
最佳答案
你已经快完成了,有两种简单的方法可以做到这一点:
# option 1 - faster way
df['team'] = [re.sub(r'[\n\r]*','', str(x)) for x in df['team']]
# option 2
df['team'] = df['team'].apply(lambda x: re.sub(r'[\n\r]*','', str(x)))
关于python - 在数据框的整个列中应用正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53962844/