如何创建我的 DataFrame 以在我的数据集的“语言”列中仅显示法国电影,而该列中有多种语言?
例子:
Languages column:
French
English
German,French,Spanish
Spanish,English,French
French, English, Gernman
我一直在尝试的只是带回仅将法语作为语言列中的值的列。 请帮忙!
我试过:
df.loc[df['column_name'] == some_value]
但它只返回法语电影,不返回法语电影,也返回其他语言电影。
最佳答案
使用str.contains
使用单词边界 (\b
) 以避免匹配子字符串(例如“Abc”匹配“Abcde”):
df.loc[df['column_name'].str.contains(r'\bFrench\b', case=False)]
如果您确定没有可能的子字符串匹配(对于语言可能是可能的):
df.loc[df['column_name'].str.contains('French', case=False)]
关于python - 如何创建我的 DataFrame 以仅在我的数据集的 'Language' 列中显示法国电影,而该列中有多种语言?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/74242920/