我有一个 C 函数:
Node * first_element_by_path(const Node * node, const char * path, char delimiter);
还有一个 Rust 胶水函数:
pub fn first_element_by_path(node: *mut CNode, path: *const c_char, delimiter: c_char) -> *mut CNode;
它需要一个 c_char
作为分隔符。我想向它发送一个 char
,但是 c_char
是一个 i8
而不是 char
。在这种情况下,如何将 Rust char
转换为 i8
或 c_char
?
最佳答案
你在问这个问题:
How do I fit a 32-bit number into an 8-bit value?
它有直接的答案:“丢弃大部分位”:
let c = rust_character as libc::c_char;
但是,这应该会让您停下来问问题:
- 其余位的编码是否正确?
- 那些我扔掉的东西怎么办?
Rust char
允许对所有 Unicode 标量值进行编码。此代码您期望的行为是什么:
let c = '💩' as libc::c_char;
可能不是创建值-87
,一个非ASCII值!或者这个不那么愚蠢但也许更现实的变体,即 -17
:
let c = 'ï' as libc::c_char;
然后您不得不问:C 代码中的字符是什么意思? C代码认为字符串是什么编码? C 代码如何处理非 ASCII 文本?
最安全的做法可能是断言该值在 ASCII 范围内:
let c = 'ï';
let v = c as u32;
assert!(v <= 127, "Invalid C character value");
let v = v as libc::c_char;
除了断言,您还可以返回一个 Result
类型,指示该值超出范围。
should I change my function (the one that will call the glue function) to receive a
c_char
instead of achar
?
这取决于。那可能只是将问题推得更远;现在,每个 调用者都必须决定如何创建 c_char
并担心 128 到 255 之间的值。如果您的代码的语义使得该值必须是ASCII 字符,然后在您的类型中对其进行编码。具体来说,您可以使用类似 ascii crate 的东西.
无论哪种情况,您都将失败的可能性插入了其他人的代码中,这让您的生活更轻松,但潜在的代价是让调用者更加沮丧。
关于char - 如何将 char 转换为 libc::c_char?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41750067/