python - 如何从具有匹配索引的数据帧中减去一系列

标签 python pandas dataframe

我有一个包含多个列的 DataFrame 和一个 Series。两者具有相同的 DateTimeIndex

我想从 DataFrame 中每行的所有值中减去 Series 中每行的值

这是我的示例数据:

dates   = pandas.date_range('20180101', periods=10)
stocks  = ['AAPL', 'GOOG', 'MSFT', 'AMZN', 'FB']
data    = numpy.random.randn(10,5)
prices  = pandas.DataFrame(index=dates, columns=stocks, data=data)
returns = prices.pct_change(1)

这给了我一个类似于以下内容的DataFrame

enter image description here

然后我创建我的系列,这是一篮子股票的返回

basket = returns.mean(axis=1)

这给了我一个类似于以下内容的系列

enter image description here

现在我想从每只股票的返回中减去一揽子返回:

excess_ret = returns - basket

我收到以下警告:

RuntimeWarning: Cannot compare type 'Timestamp' with type 'str', sort order is
undefined for incomparable objects
  return this.join(other, how=how, return_indexers=return_indexers)

这是生成的DataFrame:

enter image description here

曾经pandas-0.16.2中工作,但我现在使用pandas-0.22.0,而且看起来我现在无法从具有匹配索引DataFrame中减去Series

问题:

  • 我当前执行的减法运算发生了什么?
  • 如何从 DataFrame 中每行的所有值中减去 Series 中每行的值?

最佳答案

我认为需要sub使用参数 axis=0 通过 Series 的索引来匹配 DataFrame 的索引:

axis : {0, 1, 'index', 'columns'}

For Series input, axis to match Series index on

excess_ret = returns.sub(basket, axis=0)
print (excess_ret)
                AAPL      GOOG      MSFT      AMZN        FB
2018-01-01       NaN       NaN       NaN       NaN       NaN
2018-01-02 -1.833226 -0.110935  0.455586 -0.173553  1.662127
2018-01-03 -0.662713  1.737714 -1.295243  1.381853 -1.161611
2018-01-04  3.269817 -0.824819  0.377973 -0.788368 -2.034604
2018-01-05 -0.082528  1.814466  2.295359 -3.543489 -0.483808
2018-01-06  0.295950  2.978380  1.000856  1.346977 -5.622164
2018-01-07  1.988864 -2.316191  0.633370  1.043901 -1.349943
2018-01-08 -2.640122 -0.861669 -1.472634 -1.559951  6.534376
2018-01-09  8.062484 -1.712583 -2.497513 -0.807566 -3.044822
2018-01-10 -1.823915  0.370618 -0.883559  0.888679  1.448177
<小时/>

如果想按列匹配:

a = returns.mean(axis=0)
print (a)
AAPL    0.088224
GOOG   -1.301244
MSFT   -2.436290
AMZN   -1.009339
FB     -0.102484
dtype: float64

excess_ret = returns.sub(a, axis=1)
print (excess_ret)
                AAPL      GOOG       MSFT      AMZN        FB
2018-01-01       NaN       NaN        NaN       NaN       NaN
2018-01-02 -1.353102  1.441870   5.759181  0.421661 -0.608508
2018-01-03 -0.434575 -0.969659   0.665239  0.823154  4.917633
2018-01-04  8.771575 -2.722012   0.409977 -2.113780 -1.164615
2018-01-05 -0.220083  0.213942   1.329937 -0.372537  0.037217
2018-01-06 -0.633686  6.371478 -14.157027 -0.831583  1.226992
2018-01-07 -2.363521  0.130848   1.743317 -1.381718 -1.929583
2018-01-08 -3.062185 -6.431137   0.438800  0.956752 -1.641623
2018-01-09 -0.450300  2.093572   2.965726 -0.617335  1.042234
2018-01-10 -0.254123 -0.128903   0.844849  3.115386 -1.879747

关于python - 如何从具有匹配索引的数据帧中减去一系列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51117844/

相关文章:

python - 重构旧版 python 代码 : from u'. 。 .' to ' ...'

python - 根据列表对 Pandas 数据框进行排序

python - 将字符串日期转换为 Pandas 数据框中的不同格式

python - pandas 动态列数的平均值

python - 基于正则表达式的随机字符串生成-Python

python - 映射不同长度的迭代器

python - date_range 不接受我想要使用的变量?

python - 将 Pandas DataFrame 单元格直接导出到 excel/csv (python)

python - Spark __getnewargs__ 错误

python - pandas 选择特定组