python - ctypes c_char_p 的不同行为？

我对不同版本的 python 的这种行为感到困惑，不明白为什么？

Python 2.7.5 (default, Aug 25 2013, 00:04:04) 
[GCC 4.2.1 Compatible Apple LLVM 5.0 (clang-500.0.68)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> c="hello"
>>> a=ctypes.c_char_p(c)
>>> print(a.value) 
hello

Python 3.3.5 (default, Mar 11 2014, 15:08:59) 
[GCC 4.2.1 Compatible Apple LLVM 5.0 (clang-500.2.79)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> c="hello" 
>>> a=ctypes.c_char_p(c)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: bytes or integer address expected instead of str instance

一个工作，而另一个给我一个错误。哪一个是正确的？

如果它们都是正确的，我怎样才能在 3.3.5 中实现与 2.7 相同的行为？我想将 char 指针从 python 传递给 C。

最佳答案

c_char_p 是 _SimpleCData 的子类，_type_ == 'z'。 __init__ 方法调用类型的 setfunc，对于简单类型 'z' 是 z_set。

在 Python 2 中，z_set function (2.7.7) 被编写为处理 str 和 unicode 字符串。在 Python 3 之前，str 是一个 8 位字符串。 CPython 2.x str 内部使用了一个 C 空终止字符串(即以 \0 终止的字节数组)，为此 z_set 可以调用PyString_AS_STRING (即获取指向 str 对象的内部缓冲区的指针)。一个unicode 字符串首先需要被编码成字节串。 z_set 自动处理此编码并在 _objects 属性中保留对编码字符串的引用。

>>> c = u'spam'
>>> a = c_char_p(c)
>>> a._objects
'spam'
>>> type(a._objects)
<type 'str'>

在 Windows 上，默认的 ctypes 字符串编码是 'mbcs'，错误处理设置为 'ignore'。在所有其他平台上，默认编码是 'ascii'，带有 'strict' 错误处理。要修改默认值，请调用 ctypes.set_conversion_mode .例如，set_conversion_mode('utf-8', 'strict')。

在 Python 3 中，z_set function (3.4.1) 不会自动将 str(现在是 Unicode)转换为 bytes。 Python 3 中的范式转变为严格区分字符串和二进制数据。删除了 ctypes 默认转换，函数 set_conversion_mode 也是如此。您必须向 c_char_p 传递一个 bytes 对象(例如 b'spam' 或 'spam'.encode('utf-8' ))。在 CPython 3.x 中，z_set 调用 C-API 函数 PyBytes_AsString获取指向 bytes 对象的内部缓冲区的指针。

请注意，如果 C 函数修改了字符串，那么您需要改为使用 create_string_buffer创建一个 c_char 数组。查找类型为 const 的参数，以了解使用 c_char_p 是安全的。

关于python - ctypes c_char_p 的不同行为？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23852311/

python - ctypes c_char_p 的不同行为？

上一篇：Python Pandas 到 R 数据框

下一篇：python - Python 3 中的 FastCGI WSGI 库？