python - 如何解决python 'utf-8'错误?

标签 python python-3.x

我试图在 python 3 终端中读取 6GB 的文件,但无法执行读取文件行。代码如下:

#define data directory

data_dir = 'C://Star/star_data/csv\Globe'

#read the review dataset
yelp = pd.read_csv(data_dir+'\star_data_python.csv')
X, y = star.data, star.target
X.shape

错误:

UnicodeDecodeError                        Traceback (most recent call last)
<ipython-input-4-bc09b45c73bb> in <module>()
      4 
      5 #read the review dataset
----> 6 yelp = pd.read_csv(data_dir+'\star_data_python.csv')
      7 X, y = star.data, star.target
      8 X.shape

可能是什么问题?谢谢

最佳答案

由于您使用的是 Windows,因此请在路径前使用 r:

例如

data_dir = r'C://Star/star_data/csv/Globe'

'r' 表示该字符串将被视为原始字符串,这意味着所有转义码都将被忽略。

尝试调用 read_csv使用 encoding='latin1'encoding='iso-8859-1'encoding='cp1252';这些是 Windows 上发现的各种编码。

例如

full_path = data_dir + r'/star_data_python.csv'
pd.read_csv(full_path, encoding='latin1')

有用的答案列表:

关于python - 如何解决python 'utf-8'错误?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44845573/

相关文章:

python-3.x - Python - 无法使用 Menu.quit 从 Tkinter 退出

python - 匹配两列的值并返回索引位置列表

linux - 在 python 中等效的 openssl 命令?

python - Anaconda 3 安装错误 - 没有脚本文件夹,也没有 conda 命令提示符和快捷方式

python - 使用ARPACK求解特征值问题,但与Matlab得到的结果不一致

python - 如何让我的程序利用制表符补全?

python - 如何使用类外部的函数作为类内部的属性?

python - 编译 gVim 支持 Python 3

python - 如何查看文件的更改?

python - Beyond Compare - 如何在命令行中生成比较报告?