没有 Pandas 的Python解码excel表

标签 python excel utf-8

我正在尝试在不使用 pandas 的情况下在 python 中读取 excel 文件或 xlrd ,并且我一直在尝试将结果从 bytesutf-8没有任何成功。

xls 文件中的数据

colA    colB    colC
spc     1D0     20190705
spd     1D0     20190705
spe     1D0     20190705
... (goes on for 500k lines)

代码
with open(file, 'rb') as f:
    data = f.readlines(1)  # Just to check the first line that is printed out
    print(data[0].decode('utf-8'))

我收到的错误是 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd0 in position 0: invalid continuation byte
如果我要打印 data不解码,结果为:[b'\xd0\xcf\x11\xe0\xa1\xb1\x1a\xe1\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00>\x00\x03\x00\xfe\xff\t\x00\x06\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x9e\x00\x00\x00\x9dN\x00\x00\x00\x00\x00\x00\x00\x10\x00\x00\xfe\xff\xff\xff\x00\x00\x00\x00\xfeM\x00\x00\x01\x00\x00\x00\xffM\x00\x00\x00N\x00\x00\x01N\x00\x00\x02N\x00\x00\x03N\x00\x00\x04N\x00\x00\x05N\x00\x00\x06N\x00\x00\x07N\x00\x00\x08N\x00\x00\tN\x00\x00\n']
我没有任何理由不想使用 pandasxlrd ,如果需要,我只是尝试使用标准库解析数据。

有什么想法吗?

最佳答案

您需要先解压缩 xlsx 文件,然后才能读取其内容(假设这是您使用的格式)。

关于没有 Pandas 的Python解码excel表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56930653/

相关文章:

excel - 在列中最后一个零之前的数字处停止的动态范围

excel - 当单元格值被清除时如何触发代码?

excel - 如何在 MS Excel 中将特定数据从一个 Excel 工作表传输到另一个工作表?

python - 浮点取模问题

Python Mechanize 'NoneType object has no attribute ' click()' with br.submit(name=s)

python - 使用 tkinter 中的按钮更改变量

php - 删除或编码非 UTF-8 字符

c++ - 将文件中的utf-8字符转换为十六进制

java - 如何在 Java 中的 ISO-8859-1 和 UTF-8 之间进行转换?

python 字符串到带有格式字符串的数字