python - xlrd 读取 xls XLRDError : Unsupported format, 或损坏的文件:预期的 BOF 记录;发现 '\r\n<html>'

标签 python excel dataframe xls xlrd

这是代码:

xls = open_workbook('data.xls')

作为返回:

File "/home/woles/P2/fin/fin/apps/data_container/importer.py", line 16, in import_data
  xls = open_workbook('data.xlsx')
File "/home/woles/P2/fin/local/lib/python2.7/site-packages/xlrd/__init__.py", line 435,     in open_workbook
ragged_rows=ragged_rows,
File "/home/woles/P2/fin/local/lib/python2.7/site-packages/xlrd/book.py", line 91, in open_workbook_xls
biff_version = bk.getbof(XL_WORKBOOK_GLOBALS)
File "/home/woles/P2/fin/local/lib/python2.7/site-packages/xlrd/book.py", line 1230, in getbof
bof_error('Expected BOF record; found %r' % self.mem[savpos:savpos+8])
File "/home/woles/P2/fin/local/lib/python2.7/site-packages/xlrd/book.py", line 1224, in bof_error
raise XLRDError('Unsupported format, or corrupt file: ' + msg)
XLRDError: Unsupported format, or corrupt file: Expected BOF record; found '\r\n<html>'

文件没有损坏,我可以用Excel、LibreOffice打开它。

最佳答案

尝试用pandas打开:

import pandas as pd
data=pd.read_html(filename.xls)

或者尝试任何其他 html python 解析器。

这不是正确的 excel 文件,而是 excel 可读的 html。

关于python - xlrd 读取 xls XLRDError : Unsupported format, 或损坏的文件:预期的 BOF 记录;发现 '\r\n<html>',我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23994362/

相关文章:

python - 随机森林分类器的最后一行#5 遇到问题

python - Selenium 像崩溃一样向下滚动 Facebook 页面

java - 修改按钮单击 Apache POI 和 JavaFX 上的 Excel 单元格值

python - 使用正则表达式根据列的值在数据集中创建新列

python - 'DataFrame' 对象没有属性 'types'

python - Jupyter Notebook 在两个单元之间运行所有代码

python - 将字符串作为参数传递给 python 脚本

excel - 使用 VBA 在 Excel 中创建数据透视表时出现类型不匹配错误

excel - 如何在包含字母的每隔一个单元格上使用 =COUNTIF() ?

python - 从 4 个指定列中只获取两个值并将有效值合并到 2 列中