让 df
成为数据框,如下所示:
date text
0 2019-6-7 London is good.
1 2019-5-8 I am going to Paris.
2 2019-4-4 Do you want to go to London?
3 2019-3-7 I love Paris!
我想添加一列city
,表示text
中包含的城市,即
date text city
0 2019-6-7 London is good. London
1 2019-5-8 I am going to Paris. Paris
2 2019-4-4 Do you want to go to London? London
3 2019-3-7 I love Paris! Paris
如何在不使用 lambda
的情况下做到这一点?
最佳答案
你可以先匹配确定你有城市列表,然后 str.findall
df.text.str.findall('London|Paris').str[0]
Out[320]:
0 London
1 Paris
2 London
3 Paris
Name: text, dtype: object
df['city'] = df.text.str.findall('London|Paris').str[0]
关于python - 如何使用包含关键字对 Pandas 中的数据进行分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56944934/