python - 如何在 Python 中处理多字节字符串

标签 python string multibyte multibyte-functions

PHP 中有多字节字符串函数来处理多字节字符串(例如:CJK 脚本)。例如,我想通过在 python 中使用 len 函数来计算多字节字符串中的字母数,但它返回的结果不准确(即该字符串中的字节数)

japanese = "桜の花びらたち"
print japanese
print len(japanese)#return 21 instead of 7

PHP有没有类似mb_strlen的包或者函数?

最佳答案

使用Unicode strings :

# Encoding: UTF-8

japanese = u"桜の花びらたち"
print japanese
print len(japanese)

注意字符串前面的u

要将字节字符串转换为 Unicode,请使用 decode:"桜の花びらたち".decode('utf-8')

关于python - 如何在 Python 中处理多字节字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8346608/

相关文章:

java - 将字符串表达式转换为 boolean 表达式

C++ ifstream 跳过第一行

php - 在 cakephp3 的 session 中使用多字节时 session_start() 不成功

python - enumerate 是否创建其参数的副本?

Python Pygame Loop 异常延迟

python - 为 Python 安装 ggplot

python - 如何在 Python 中实现平均感知器(不使用 Scikit-learn)

C# 字符串数组替换最后一个元素

php - 为什么默认情况下 PHP 字符串函数不是多字节安全的?

windows - 如何让 Emacs dired 模式在 Windows 中显示 unicode 字符?