python - Pandas "read_sql"UnicodeDecodeError

标签 python database pandas vertica

我使用 pandas 从 Vertica 数据库读取数据:

pd.read_sql(query, self._conn)

但是失败了

UnicodeDecodeError:“utf-8”编解码器无法解码位置 1 中的字节 0xe9:无效的连续字节

其他查询不会失败,因此问题 出在该查询的某些特定列中。

我需要所有数据 - 我该怎么办?我也可以在 Vertica 中进行更改,但我无法更改表值...

附言这就是我为 Vertica 创建连接的方式:

conn_info = url2vertica(url)
conn_info["read_timeout"] = 2400
conn_info["ssl"] = False
vrt = vertica_python.connect(**conn_info)

最佳答案

实际上,我想到了这个解决方案:在 sql 查询中使用 isUTF8()

也在 here 中,在 UTF-8 编码问题 中,我们可以通过 'unicode_error': 'ignore' 忽略错误。

关于python - Pandas "read_sql"UnicodeDecodeError,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47529906/

相关文章:

database - 数据库对于管理信息有多重要?

mysql - 在mysql数据库中存储时区信息

Python追加列表重复最后一个元素?

python - NameError:名称 'container' 未定义 Python Webscraping

python - OpenCV imwrite 函数导致 'undefined symbol'

python - 我应该如何使用 scikit learn 对以下列表列表进行矢量化?

php - 使用 Laravel Artisan 迁移多个数据库

python - 有没有办法在 pandas DataFrame 中将 'search' 用于列中的 2 个特定数字并返回索引(如果存在)?

python - 使用python访问函数内部的字典

sorting - Pandas 分组按降序排序