python - 如何在特定条件下仅获取数据帧的第二个索引

标签 python pandas dataframe pandas-loc

首先,我对 python 还很陌生,所以请放轻松。
我需要从数据框中获取特定值。

我得到了这个代码:
第一个输入的数据框:

symbol   date          bmo amc             company name
AAP 2019-05-22 Before The Open Advance Auto ADI 2019-05-22 Before The Open Analog Devices CM 2019-05-22 Before The Open CIBC CSWI 2019-05-22 Before The Open CSW Industrials KLXE 2019-05-22 Before The Open KLX Energy Services

for stock_symbol in mystocks:
    print(stock_symbol)

输入:

#get the date from the date column
ddate = df_earning_calander.loc[
    df_earning_calander.index == stock_symbol, 'date'][stock_symbol]
print(ddate)

输出:

AAP
2019-05-22 00:00:00


第二个输入的数据框:

symbol         Stock name         date               ...
AAP     Advance Auto Parts Inc 2018-11-13            ...
AAP     Advance Auto Parts Inc 2019-02-15            ...
AAP     Advance Auto Parts Inc 2019-02-19            ...
AAP     Advance Auto Parts Inc 2019-05-21            ...
AAP     Advance Auto Parts Inc 2019-05-22            ...
input:

#get all the dates from the date column
ddate_12 = df_earnings_12.loc[
    df_earnings_12.index == stock_symbol, 'date'][stock_symbol]
print(ddate_12)

输出:

AAP   2018-11-13
AAP   2019-02-15
AAP   2019-02-19
AAP   2019-05-21
AAP   2019-05-22
Name: date, dtype: datetime64[ns]
if ddate in ddate_12:
    continue

好吧,我正在尝试检查第一个数据框中的日期是否在第二个数据框中(虽然股票名称相同)。
此代码不会转到下一个可迭代对象。我认为这是因为第二个输出给了我股票名称和日期,而不仅仅是日期。

最佳答案

您可以只选择日期列,通过Series.reset_index创建2列DataFrame如果可能的话,重复对添加 DataFrame.drop_duplicates :

df1 = df_earning_calander['date'].reset_index().drop_duplicates()
print (df1)
  symbol        date
0    AAP  2019-05-22
1    ADI  2019-05-22
2     CM  2019-05-22
3   CSWI  2019-05-22
4   KLXE  2019-05-22

df2 = df_earnings_12['date'].reset_index().drop_duplicates()
print (df2)
  symbol        date
0    AAP  2018-11-13
1    AAP  2019-02-15
2    AAP  2019-02-19
3    AAP  2019-05-21
4    AAP  2019-05-22

然后,对于具有相同列名的两个数据帧之间的交集,请使用 DataFrame.merge使用默认内部联接 - 获取与两者之间的所有日期时间匹配的所有符号:

df = df1.merge(df2)
print (df)
  symbol        date
0    AAP  2019-05-22

如果需要测试符号列表,则最后一个比较列 df['symbol'] 的 bool 掩码,并通过 Series.any 测试是否至少有一个 True :

mystocks = ['ADI','AAP']
for stock_symbol in mystocks:
    if ((df['symbol'] == stock_symbol).any()):
        print (f'Matched {stock_symbol}')
        #Matched AAP

关于python - 如何在特定条件下仅获取数据帧的第二个索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56324989/

相关文章:

python - 根据其中一列中的值类型交换列中的值

python - 将数据帧的第 0 行设置为标题

python - Pandas 将项目添加到一系列列表数据类型

python - 使用 scrapy 在多页上递归获取链接

java - 创建 TreeMap 可视化

python - Spark 中按年和月计算的日历化成本

根据 R 中的条件删除数据框列

python - 有人能解释一下这个错误到底是什么意思,TypeError : issubclass() arg 1 must be a class

python-3.x - 根据条件删除 DataFrame 中的元素

python - 查找 pandas 中两个数据帧的差异和串联