这是我正在使用的数据框。
df = pd.DataFrame({'id' : ['45', '45', '45', '45', '46', '46'],
'description' : ['credit score too low', 'credit score too low', 'credit score too low', 'high risk of fraud', 'address not verified', 'address not verified']})
print(df)
我正在尝试修改数据框,以便对于给定的 ID,没有重复的描述。下面的数据框是所需的输出。
newdf = pd.DataFrame({'id' : ['45', '45', '46'],
'description' : ['credit score too low', 'high risk of fraud', 'address not verified']})
print(newdf)
最佳答案
您可以使用 .drop_duplicates()
[pandas-doc] 删除重复项。例如:
>>> df
id description
0 45 credit score too low
1 45 credit score too low
2 45 credit score too low
3 45 high risk of fraud
4 46 address not verified
5 46 address not verified
>>> df.drop_duplicates()
id description
0 45 credit score too low
3 45 high risk of fraud
4 46 address not verified
因此,您可以将 df
设置为新的数据帧,例如:
df = df<b>.drop_duplicates()</b>
关于python - Pandas 仅显示给定 id 的数据框中值的唯一实例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57239426/