python-2.7 - 我如何使用 Pandas (python) 读取 7z 文件并将其转换为 csv?

标签 python-2.7 csv pandas 7zip sklearn-pandas

我有 7z 个文件,我想使用 Pandas 将它们转换为 csv 来预处理数据。我有 python 2.7。

我试过这个:

import pandas as pd
data = pd.read_csv('train_2011_2012_2013.7z.002', header = None)
print data

我遇到了这个错误

CParserError                              Traceback (most recent call last)
<ipython-input-9-74098fd0c476> in <module>()
      1 
----> 2 data = pd.read_csv('train_2011_2012_2013.7z.001', header = None)
      3 print data

/root/anaconda2/lib/python2.7/site-packages/pandas/io/parsers.pyc in parser_f(filepath_or_buffer, sep, delimiter, header, names, index_col, usecols, squeeze, prefix, mangle_dupe_cols, dtype, engine, converters, true_values, false_values, skipinitialspace, skiprows, skipfooter, nrows, na_values, keep_default_na, na_filter, verbose, skip_blank_lines, parse_dates, infer_datetime_format, keep_date_col, date_parser, dayfirst, iterator, chunksize, compression, thousands, decimal, lineterminator, quotechar, quoting, escapechar, comment, encoding, dialect, tupleize_cols, error_bad_lines, warn_bad_lines, skip_footer, doublequote, delim_whitespace, as_recarray, compact_ints, use_unsigned, low_memory, buffer_lines, memory_map, float_precision)
    560                     skip_blank_lines=skip_blank_lines)
    561 
--> 562         return _read(filepath_or_buffer, kwds)


CParserError: Error tokenizing data. C error: Expected 1 fields in line 17, saw 2

这附近有什么问题吗?

最佳答案

安装pyunpack和patool

pip 安装 pyunpack

pip 安装 patool

写完后运行下面的代码:

from pyunpack import Archive
Archive('Downloads\asdfg.7z').extractall("output path")

在输出路径中,您将找到存储文件的解压文件夹。

关于python-2.7 - 我如何使用 Pandas (python) 读取 7z 文件并将其转换为 csv?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41191991/

相关文章:

python - Python 中的 USB 内存棒序列号

python-2.7 - OpenERP IOError : decoder zip not available

python - 如何在与 dictwriter 一起使用时正确删除 python 中的回车符(换行符 ='' 没有帮助)

linux - 在 bash 中,循环并发送命令来执行

python - 如何将字数列表转换为数据框以进行情感分析

python - Python 上的正则表达式在使用 char 类时打印垃圾

python - 如何在不定义任何限制的情况下在 python 中获取任意数量的输入?

database - Virtuemart2 csv导入数据库不断崩溃

python - 将 DF 行乘以系数

python - 在groupby之后对每个组进行相当复杂的计算