python - 从 HBase 解码 HappyBase 数据

标签 python encoding decoding happybase

在尝试解码来自 HBase 的值时,我看到了一个错误,但很明显 Python 认为它不是 UTF-8 格式,而是将数据放入 HBase 的 Java 应用程序仅以 UTF-8 编码

a = '\x00\x00\x00\x00\x10j\x00\x00\x07\xe8\x02Y' a.decode("UTF-8") Traceback (most recent call last): File "", line 1, in File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py", line 16, in decode return codecs.utf_8_decode(input, errors, True) UnicodeDecodeError: 'utf8' codec can't decode byte 0xe8 in position 9: invalid continuation byte

有什么想法吗?

最佳答案

该数据不是有效的 utf-8,所以如果您真的从数据库中检索到它,您应该检查是谁/什么把它放在那里的。

关于python - 从 HBase 解码 HappyBase 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33433262/

相关文章:

python - 预取某些对象返回空值

Java Base64 Sun 到 JDK8

python - 为什么对 formdata 进行 urlencode 然后用 utf-8 再次编码,这里的逻辑是什么?

python - 如何 "decode"python scapy数据包 "RAW load"

python - 日志回滚时的主管异常导致应用服务器卡住?

python - 无法分割手写字符

cookies - 语言不可知的 cookie 编码/解码标准

java - Java中的HTML实体解码: apostrophe

python - OpenAI API 错误 : "No module named ' openai. embeddings_utils'; 'openai' 不是包”

c# - 将一串数字加密为一串字母数字