pandas - XLRDError : Unsupported format, 或损坏的文件

使用 pandas 读取 .xlsx 文件时出现错误。看起来它正在打开文件，因为它能够读取列名的前 8 个字符，即 员工 ID，但因此错误而失败。我看到很多关于此的帖子，但最后一部分从来都不是这些错误消息中的列名称。有什么建议吗？

在开发环境中，当我以 Excel 形式打开此文件并重新加载到服务器时，它起作用了。

错误:XLRDError:格式不受支持，或文件损坏:需要 BOF 记录；找到“员工”

最佳答案

如 release email 中所述，链接至 release tweet并在documentation首页上出现的大橙色警告中注明，橙色较少，但仍然存在于 readme on the repo 中和 release on pypi :

xlrd 已明确删除对 xls 文件以外的任何内容的支持。

这是由于使用 xlrd 1.2 或更早版本读取 .xlsx 文件时存在潜在的安全漏洞。

可用的解决方案:

确保您使用的是最新版本的 pandas，至少为 1.0.1，并且最好是最新版本。安装 openpyxl:https://openpyxl.readthedocs.io/en/stable/ 将您的 pandas 代码更改为:

pandas.read_excel('cat.xlsx', engine='openpyxl')

下一个 pandas 版本 pandas 1.2 将默认执行此操作。

关于pandas - XLRDError : Unsupported format, 或损坏的文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/66469030/

相关文章：

python - 强制 Selenium 暂停并等待字段可用