python - 处理 pandas read csv 的问题

标签 python pandas

我对 pandas read_csv 有疑问。我有很多与股票市场相关的 txt 文件。它是这样的:

SecCode,SecName,Tdate,Ttime,LastClose,OP,CP,Tq,Tm,Tt,Cq,Cm,Ct,HiP,LoP,SYL1,SYL2,Rf1,Rf2,bs,s5,s4,s3,s2,s1,b1,b2,b3,b4,b5,sv5,sv4,sv3,sv2,sv1,bv1,bv2,bv3,bv4,bv5,bsratio,spd,rpd,depth1,depth2  
600000,浦发银行,20120104,091501,8.490,.000,.000,0,.000,0,0,.000,0,.000,.000,.000,.000,.000,.000, ,.000,.000,.000,.000,8.600,8.600,.000,.000,.000,.000,0,0,0,0,1100,1100,38900,0,0,0,.00,.000,.00,.00,.00
600000,浦发银行,20120104,091506,8.490,.000,.000,0,.000,0,0,.000,0,.000,.000,.000,.000,.000,.000, ,.000,.000,.000,.000,8.520,8.520,.000,.000,.000,.000,0,0,0,0,56795,56795,33605,0,0,0,.00,.000,.00,.00,.00
600000,浦发银行,20120104,091511,8.490,.000,.000,0,.000,0,0,.000,0,.000,.000,.000,.000,.000,.000, ,.000,.000,.000,.000,8.520,8.520,.000,.000,.000,.000,0,0,0,0,56795,56795,34605,0,0,0,.00,.000,.00,.00,.00
600000,浦发银行,20120104,091551,8.490,.000,.000,0,.000,0,0,.000,0,.000,.000,.000,.000,.000,.000, ,.000,.000,.000,.000,8.520,8.520,.000,.000,.000,.000,0,0,0,0,56795,56795,35205,0,0,0,.00,.000,.00,.00,.00
600000,浦发银行,20120104,091621,8.490,.000,.000,0,.000,0,0,.000,0,.000,.000,.000,.000,.000,.000, ,.000,.000,.000,.000,8.520,8.520,.000,.000,.000,.000,0,0,0,0,57795,57795,34205,0,0,0,.00,.000,.00,.00,.00

当我使用这段代码阅读它时:

fields = ['SecCode', 'Tdate','Ttime','LastClose','OP','CP','Rf1','Rf2']  
df = pd.read_csv('SHL1_TAQ_600000_201201.txt',usecols=fields)

但是我遇到了一个问题:

Traceback (most recent call last):
  File "E:/workspace/Senti/highlevel/highlevel.py", line 8, in <module>
    df = pd.read_csv('SHL1_TAQ_600000_201201.txt',usecols=fields,header=1)
  File "D:\Anaconda2\lib\site-packages\pandas\io\parsers.py", line 562, in parser_f
    return _read(filepath_or_buffer, kwds)
  File "D:\Anaconda2\lib\site-packages\pandas\io\parsers.py", line 315, in _read
    parser = TextFileReader(filepath_or_buffer, **kwds)
  File "D:\Anaconda2\lib\site-packages\pandas\io\parsers.py", line 645, in __init__
    self._make_engine(self.engine)
  File "D:\Anaconda2\lib\site-packages\pandas\io\parsers.py", line 799, in _make_engine
    self._engine = CParserWrapper(self.f, **self.options)
  File "D:\Anaconda2\lib\site-packages\pandas\io\parsers.py", line 1257, in __init__
    raise ValueError("Usecols do not match names.")
ValueError: Usecols do not match names.

我找不到任何类似我的问题。而且当我将txt文件复制到另一个文件时它是有线的,代码运行良好,但原来的导致上述问题。我该如何解决?

最佳答案

在您的消息中,您说您正在运行:

df = pd.read_csv('SHL1_TAQ_600000_201201.txt',usecols=fields)

这并没有为我和@Anil_M 抛出错误。但是从你的回溯中,可以看出使用的是另一个命令:

df = pd.read_csv('SHL1_TAQ_600000_201201.txt',usecols=fields, header=1)

其中包含一个 header=1 并抛出上述错误。

所以,我猜这个错误是由于您的代码有些困惑造成的。

关于python - 处理 pandas read csv 的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40134664/

相关文章:

Python 转换矩阵

python - 分组和计算频率,Pandas

python - 如何在 django 中使用 ajax 形式验证 django-recaptcha

python Pandas : How can I sum all of the values of a dictionary in a column of my dataframe?

python - 如何使用来自多列的值对 Pandas 数据框进行排序?

python - 使用 pyodbc 连接到 MS Access

python - 如何获取列表中附加的多个数据帧的平均值、标准差和疯狂值?

python - pretty-print JSON python

python - 使用 Pandas 组合列

python - pyopenCL,openCL,无法在GPU上构建程序