我有一个 .csv 文件,其中包含多列,其中一列称为 Date
,并且具有 2018 年的日期值,如下所示:
此列的 .csv 格式为日期
。
我将在我的源代码中执行以下操作:
import pandas as pd
# Load data
data_daily = pd.read_csv('Desktop/data_daily.csv', keep_default_na=True)
# Filter data_daily down to only October
data_daily = data_daily[(data_daily['Date'] > '01/10/2018') & (data_daily['Date'] < '31/10/2018')]
# Save as a new .csv file
data_daily.to_csv('Desktop/final.csv', index=False)
但是,最终的 .csv 文件包含所有日期,而不仅仅是我想要的日期。
我不知道这是否会产生影响,但请记住,有多行具有相同的日期。
我该如何解决这个问题?
最佳答案
首先在read_csv
中添加参数parse_dates
将列解析为日期时间:
data_daily = pd.read_csv('Desktop/data_daily.csv',
keep_default_na=True,
parse_dates=['Date'],
dayfirst=True)
然后使用您的解决方案或替代方案 between
将字符串转换为时间戳:
s = pd.Timestamp('2018-10-01')
e = pd.Timestamp('2018-10-31')
data_daily = data_daily[data_daily['Date'].between(s, e, inclusive=False)]
关于python - 无法过滤 pandas 数据框中的日期,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54461105/