我正在尝试在大型数据框中搜索特定日期。日期在 data_value
列中可能有多个值。找到日期后,我从与该数据关联的一组可能值中提取最大值。
有没有办法提高效率?现在运行速度很慢。
max_temps = []
for date in dates:
value = data_w[data_w['Date']==date]['Data_Value'].max()
max_temps.append(value)
最佳答案
如果我正确理解你的问题,那么你需要这样,
temp=data_w[data_w['Date'].isin(dates)]
print temp.groupby('Date')['Data_Value'].max()
说明:
首先在大型数据框中应用 isin
,然后应用 groupby
并从中取出 max
关于python - 通过数据框进行高效搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53368628/