python - Unicode 字符名称的官方存储库

标签 python string unicode

有几种方法可以获取所有 Unicode 字符名称的列表:例如使用 Python 模块 unicodedata ,如 List of unicode character names 中所述,或使用网站:https://unicode.org/charts/charindex.html但这里不完整,您必须打开并解析 PDF 才能找到名称。

但是所有 Unicode 字符名称的官方来源/存储库是什么?(这样如果添加了新字符,列表就会更新,所以我正在寻找这些的初始来源名称,以机器可读的格式)。

我正在寻找一个仅包含 code pointname 的 CSV 或任何其他格式的列表:

code   character name
...
0102   LATIN CAPITAL LETTER A WITH BREVE
0103   LATIN SMALL LETTER A WITH BREVE
...

最佳答案

实际角色数据(包括角色名称和许多其他详细信息)的官方来源是 the Unicode Character Database .

可以通过http://www.unicode.org/Public/UCD/latest/ 访问最新版本的数据文件。 .

具体名字可以在the files NamesList.txt中找到.该文件的格式是 described here .

这是 CSV 格式的列表:https://www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt

关于python - Unicode 字符名称的官方存储库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65158620/

相关文章:

python - pytest - 如何将 pytest_addoption 值传递给 pytest 参数化?

string - 将单词转换为唯一标识符

Python:将空字符串与 False 进行比较是 False,为什么?

string - 配置单元转换为日期dd-MM-yyyy

python - Pandas:通过时间戳获取观察结果

python - 如何检测文本是否旋转 180 度或上下颠倒

python - 从 python 代码将 unicode 值插入 sqlite

delphi - 有人用过德尔福的ICU吗?

python - 在 python 中运行多个 OLS 回归

javascript - Parsley.js 除了英文字母之外还验证僧伽罗语泰米尔语(非英语字符)