python - 从 Pandas 和 unicode 错误创建 h2o 数据框

标签 python python-3.x dataframe unicode h2o

如何安全地将 pandas 对象转换为 h2o 数据框?

import h2o
import pandas as pd

df = pd.DataFrame({'col1': [1,1,2], 'col2': ['César Chávez Day', 'César Chávez Day', 'César Chávez Day']})
hf = h2o.H2OFrame(df)  #gives error

UnicodeEncodeError: 'ascii' codec can't encode character '\xe9' in position 4: ordinal not in range(128)

环境:Python 3.5,h2o 3.10.4.2

最佳答案

我同意这不是特定于 H2O 的问题。这对我有用(相同的 H2O 和 Python 版本):

import h2o
import pandas as pd

df = pd.DataFrame({'col1': [1,1,2], 'col2': ['César Chávez Day', 'César Chávez Day', 'César Chávez Day']})
hf = h2o.H2OFrame(df)

## -- End pasted text --
Parse progress: |█████████████████████████████████████████████████████████| 100%

In [4]: hf
Out[4]:   col1  col2
------  ----------------
     1  César Chávez Day
     1  César Chávez Day
     2  César Chávez Day

[3 rows x 2 columns]

In [5]: type('César Chávez Day')
Out[5]: str

我的规范(您可能需要更改默认编码):

In [6]: import sys

In [7]: sys.getdefaultencoding()
Out[7]: 'utf-8'

此线程可能有帮助:How do I check if a string is unicode or ascii?

关于python - 从 Pandas 和 unicode 错误创建 h2o 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43095970/

相关文章:

python - 将下限和上限添加到 Pandas 数据框中的所有值

python - pandas DataFrame 中列的更短符号

python - 在 QuantLib 中使用离散股息和 repo 曲线为美国股票期权定价

python - 如何在 SymPy 中创建一个参数本身就是随机变量的随机变量?

python - 如何使用 Pandas 将最后一行移到第一行

python - 为什么这个类描述符 __get__ 方法返回 self?

python - Python中的Pyo:未定义名称 'Server'

Python 和 libxml2 : how to iterate in xml nodes with XPATH

python-3.x - 使用 Python 只读取大型 wav 文件的一部分

python - 如何选择 DataFrame 中索引行之前的 n 行?