python - 由于 unicode 解码错误,无法在 pandas 中打开 csv 文件

标签 python python-3.x pandas

我使用

将 Pandas 数据框保存为 csv
df_to_save.to_csv(save_file_path)

但是当我在使用中读回它时

df_temp = pd.read_csv(file_path)

我收到一条错误消息说

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbf in position 158: invalid start byte

我已经尝试通过打开 csv 文件来强制读取它的编码为 utf-8

df_temp = pd.read_csv(file_path, index_col=False, encoding="utf-8",sep=',') 

真的卡住了,有人能帮忙吗?

非常感谢

最佳答案

更改分类数据的编码:

def my_func(df):
    for col in df.columns:
        df[col] = df[col].str.decode('iso-8859-1').str.encode('utf-8')

此函数将就地更改分类数据的编码。

关于python - 由于 unicode 解码错误,无法在 pandas 中打开 csv 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41057758/

相关文章:

python - 在 Python 文档中保持别名类型简单?

python - 如何使用递归函数检查两个节点是否连接

python-3.x - 一等函数的词汇表

Pandas 为每行获取上下栅栏

python - 在 Windows 上将 Tensorflow 与 Anaconda 和 PyCharm 结合使用

Python - 生成父/子字典结构

python - pandas 中高效的列内操作

Python 3.6 - 使用异步函数进行过滤

python - pandas 在 groupby 上设置 withcopywarning

Python Pandas 按小时和计数行对日期时间进行分组