python - 如何使用包含关键字对 Pandas 中的数据进行分类

标签 python pandas

df 成为数据框,如下所示:

      date   text
0  2019-6-7  London is good.             
1  2019-5-8  I am going to Paris.        
2  2019-4-4  Do you want to go to London?
3  2019-3-7  I love Paris!   

我想添加一列city,表示text中包含的城市,即

       date  text                          city
0  2019-6-7  London is good.               London
1  2019-5-8  I am going to Paris.          Paris 
2  2019-4-4  Do you want to go to London?  London
3  2019-3-7  I love Paris!                 Paris 

如何在不使用 lambda 的情况下做到这一点?

最佳答案

你可以先匹配确定你有城市列表,然后 str.findall

df.text.str.findall('London|Paris').str[0]
Out[320]: 
0    London
1     Paris
2    London
3     Paris
Name: text, dtype: object
df['city'] = df.text.str.findall('London|Paris').str[0]

关于python - 如何使用包含关键字对 Pandas 中的数据进行分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56944934/

相关文章:

Python pandas str. 从不干净的列中提取年份信息

python - 合并一个数据帧中与另一数据帧中的特定列不匹配的行 Python Pandas

python - 在 Pandas 数据框中的日期时间列中查找时隙数

python - Pandas 将列转换为不同的数据类型

python - 无法在python3中使用正则表达式搜索 '\\n'

python - Lyapunov 指数代码输出 Nolds

python - 了解 Pillow 中的 histogram()

python - memcached 使用 Django 监听 UDP

python - 如何手动创建 scikit-learn 树?

Python Pandas 按多个字符串过滤列