python - Pandas :切片多索引数据框......需要简单的系列

标签 python pandas

我通过从 DataReader 获取面板并将其转换为多索引数据框来创建股票数据的多索引。有时,当我使用 .loc 时,我会得到一个具有 1 个索引的系列,有时我会得到一个具有两个索引的系列。如何按日期切片并获得具有一个索引的系列?代码将帮助...

import pandas_datareader.data as web

# Define the securities to download
symbols = ['AAPL', 'MSFT']

# Define which online source one should use
data_source = 'yahoo'

# Define the period of interest
start_date = '2010-01-01'
end_date = '2010-12-31'

# User pandas_reader.data.DataReader to load the desired data. 
panel = web.DataReader(symbols, data_source, start_date, end_date)

# Convert panel to multiindex dataframe
midf = panel.to_frame()

# for slicing multiindex dataframes it must be sorted
midf = midf.sort_index(level=0)

这里我选择我想要的列:

adj_close = midf['Adj Close']
adj_close.head()

我得到一个包含两个索引(Dateminor)的系列:

Date        minor
2010-01-04  AAPL     27.505054
            SPY      96.833946
2010-01-05  AAPL     27.552608
            SPY      97.090271
2010-01-06  AAPL     27.114347
Name: Adj Close, dtype: float64

现在我使用 : 选择苹果来选择所有日期。

aapl_adj_close = adj_close.loc[:, 'AAPL']
aapl_adj_close.head()

并获取索引为 Date 的系列。这就是我要找的!

Date
2010-01-04    27.505054
2010-01-05    27.552608
2010-01-06    27.114347
2010-01-07    27.064222
2010-01-08    27.244156
Name: Adj Close, dtype: float64

但是当我实际按日期切片时,我没有得到那个系列:

sliced_aapl_adj_close  = adj_close.loc['2010-01-04':'2010-01-06', 'AAPL']
sliced_aapl_adj_close.head()

我得到一个有两个索引的系列:

Date        minor
2010-01-04  AAPL     27.505054
2010-01-05  AAPL     27.552608
2010-01-06  AAPL     27.114347
Name: Adj Close, dtype: float64

切片是正确的,值也是正确的,但我不希望其中有次要索引(因为我想将这个系列传递给绘图)。切片的正确方法是什么?

谢谢!

最佳答案

您可以使用:

df = df.reset_index(level=1, drop=True)

或者:

df.index = df.index.droplevel(1)

另一种解决方案是通过 unstack reshape 对于 DataFrame 然后通过 [] 选择:

df = adj_close.unstack()

print (df)
minor            AAPL        SPY
Date                            
2010-01-04  27.505054  96.833946
2010-01-05  27.552608  97.090271
2010-01-06  27.114347        NaN

print (df['AAPL'])

Date
2010-01-04    27.505054
2010-01-05    27.552608
2010-01-06    27.114347
Name: AAPL, dtype: float64

关于python - Pandas :切片多索引数据框......需要简单的系列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46658901/

相关文章:

python - Pandas:从数据帧返回行,其中多个列子集不为零

python - 减少大量数据帧的 pandas concat 的内存使用量

python - 如何使用 pandas 比较数据框中的两个日期列?

python - 需要 python 字典循环帮助

python - 如何在 tweepy 上搜索一条推文中的多个单词?

python - 哈里斯角点检测器 python

python - 使用 sklearn 找出错误率

python - 如何查找具有维基数据代码 Q89 =>(apple) 的项目名称

python - Pandas - 在数据框中创建滚动百分比

python - 将 Pandas 数据帧中的所有 NaT 值更改为 Timedelta 00 :00:00