python - 在Mac上的pandas中打开csv文件时出现utf-8错误

标签 python pandas csv utf-8

我正在尝试在 Mac 上使用 utf8 打开包含日语字符的 csv 文件。

我使用的代码如下:

foo = pd.read_csv("filename.csv", encoding = 'utf8')

但是,我收到以下错误消息。

'utf-8' codec can't decode byte 0x96 in position 0

我尝试环顾四周,但很多解决方案似乎都适用于 Windows/我还没有在其他解决方案上取得任何成功。

感谢您的帮助!

最佳答案

看来你的文件确实有一个非unicode字符。该文件的正确编码很大程度上取决于其内容,但在最常见的情况下,0x96 可以使用 CP-1252 进行解码。因此,只需尝试按如下方式对其进行解码:

foo = pd.read_csv("filename.csv", encoding = 'cp1252')

如果您不知道文件的原始编码,可以尝试使用第三方库进行检测,如 chardet .

如果您上传文件的一部分来重现问题,我可能会为您提供更多帮助。

关于python - 在Mac上的pandas中打开csv文件时出现utf-8错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49561407/

相关文章:

python - pandas:以排名为中心

python - 有条件地拆分 PySpark 列表中的逗号分隔值

python - 如何获得两个矩阵之间的标量乘法?

python - Django App 中的 Dajaxice 自动发现(无法导入名称 dajaxice_autodiscover)

python - 多索引数据帧的每一行的减法表(差异)

python - 统一码编码错误 : 'utf-8' codec can't encode character '\ud83d' in position 388: surrogates not allowed

python - Excel Pandas 关于 IndexingError 的 Python 问题,可以搜索并删除包含某些单词的列,但不能删除行

python - pytorch中矩阵和向量之间的加/减

csv - Logstash:为 Elasticsearch 解析多行字段

python - 将多个列表写入 CSV 中单个单元格中的不同列