C libxml 编码问题。

标签 c linux utf-8 libxml2 biometrics

使用 libxml2 两天后我就遇到了一个问题,这让我很烦。

基本上,我使用套接字通过网络发送一个 xml 缓冲区。当我在服务器上收到它并尝试解析它时,它说:

parser error : Input is not proper UTF-8, indicate encoding ! Bytes: 0xFF 0xFF 0xFF 0xFF

我试图发送的 xml 树的一个标签 (biometricData) 包含奇怪的奇怪字符,因为这是加密数据的原始缓冲区。

<biometricData>������������������������

</biometricHeader><biometricData>
                               ^

客户端:

xmlDocDumpMemoryEnc(doc, &(*out), &buffersize, "UTF-8");

服务器端:

int verify(unsigned char *data, int len) //The routine to check the data and authenticate user.

 xmlParserCtxtPtr ctx_ptr = xmlNewParserCtxt();
 doc = xmlCtxtReadMemory(ctx_ptr, (const char*)data, len, "data.xml", "UTF-8", 0);

服务器抛出这个错误:

Entity: line 2: parser error : Input is not proper UTF-8, indicate encoding !
Bytes: 0xFF 0xFF 0xFF 0xFF
d>2.23.42.9.10.4.2</oid></formatOwner></format></biometricHeader><biometricData>
                                                                               ^

我尝试更改以将服务器端的编码更改为 ISO-8859-1,并且成功了!但是,当我尝试执行 nodeGetContent(biometricData) 时,数据未采用其原始编码,因此缓冲区完全无用。

感谢您抽出时间。 我搜索了 xmlCharEncodingHandler 但没有成功...

最佳答案

使用 base64 对所有二进制数据进行编码。 XML 解析器通常不能/不会处理二进制数据。

我不知道您处理了多少二进制数据,所以如果 base64 编码/解码变得低效,请查看 http://www.xml.com/pub/a/98/07/binary/binary.html

关于C libxml 编码问题。,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32350837/

相关文章:

c - C 代码的输出,例如通过引用调用

c - 验证整数输入和一般情况

linux - 如何检查我的 Eclipse 的 gcc C++ 编译器版本?

utf-8 - 对于非英语字符, 'case insensitive' 在 RFC 3986 中意味着什么?

php - 不区分大小写的 utf8 选择

c - 当有两个分支要分支时,一个代码应该如何构造

c - 如何编译APRON的例子?

python - 数据打印不正确

Java 字符串编码 - Linux 与 Windows 不同

尝试将字符串编码/解码为 UTF-8 后引发 Java 服务器线程空指针异常错误