python - 使用 pandas 对象进行算术

标签 python string pandas

我想用Python计算两个Pandas系列之间的差异。不幸的是,返回了一个我无法理解的错误。我的代码的相关部分是:

import urllib.request 
import pandas as pd 

base_url = "http://ichart.finance.yahoo.com/table.csv?s="

def get_data(base_url,ticker):
    url = base_url + ticker
    source = urllib.request.urlopen(url)
    return  pd.read_csv(source,index_col=0,parse_dates=True,header=None)

ticker_list = {'INTC': 'Intel'}

for ticker in ticker_list:
    prices = get_data(base_url,ticker)
    prices.columns = 'Open','High','Low','Close','Volume','Adj Close'
    closing_prices = prices['Close']
    begin = closing_prices.ix[['2013-01-03']]
    end = closing_prices.ix[['2013-12-27']]
    difference = end.sub(begin)

Python 返回以下错误:

 TypeError: unsupported operand type(s) for -: 'str' and 'str'

但是,type(begin)type(end) 一样返回 pandas.core.series.Series。我使用了 end.sub() 方法,因为我想遵守此处所述的说明:http://pandas.pydata.org/pandas-docs/dev/generated/pandas.Series.sub.html 。为了尝试解决我的问题,我(除其他外)遵循了以下建议:Subtract a column from one pandas dataframe from another没有效果。

你知道我的代码中的错误埋在哪里吗?特别是,为什么 Python 会声明我尝试对字符串进行减法?我很感激任何帮助!

更新:根据@EdChum的评论,我想发布一些数据:输入begin给出:

`2013-01-03    21.32
 Name: Close, dtype: object

close_prices.head() 给出:

`0
Date          Close
2014-08-07    32.68 
2014-08-06    32.85
2014-08-05    32.82
2014-08-04    34.05
Name: Close, dtype: object` 

最佳答案

我必须将 urllib 更改为 urllib2,并将 urllib.request.urlopen 更改为 urllib2.urlopen ..但是,它应该是相同的。第一个问题是由将列名存储为值引起的。消除 header=None 可以解决这个问题。

这应该为您提供指定的第一个日期和最后一个日期之间的差异:

import urllib2
import pandas as pd 

base_url = "http://ichart.finance.yahoo.com/table.csv?s="

def get_data(base_url,ticker):
    url = base_url + ticker
    source = urllib2.urlopen(url)
    return  pd.read_csv(source,index_col=0,parse_dates=True)

ticker_list = {'INTC': 'Intel'}

编辑-一定要检查数据的排序。对我来说,它将最新的放在顶部,最旧的放在底部。

for ticker in ticker_list:
    prices = get_data(base_url,ticker)
    prices.columns = 'Open','High','Low','Close','Volume','Adj Close'
    closing_prices = prices['Close']
    closing_prices = closing_prices['2013-01-03':'2013-12-27']
    difference = closing_prices['2013-12-27'].values - closing_prices['2013-01-03'].values
    print difference

关于python - 使用 pandas 对象进行算术,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25205561/

相关文章:

python - 根据列的值将 Pandas 数据框拆分为多个数据框

python - 为什么这些字符串不相等? (Python)

java - 比较 DataOutputStream 和 Java 中的字符串

python - 使用 Pandas 将 DF 列表与交替列输出合并

python - Pandas 数据框将每一组除以一个函数中的最大值

java - java比较两个字符串的元素

python - python 中与变量限制积分

python - 在 python 中通过 ftp 更改权限

Windows 上的 python os.path.join 忽略第一个路径元素?

.net - String.Split 的异常行为