我正在寻找一个包含语言代码和相应语言的语言名称的文件。如果列表按母语人士的数量排序,那就太好了。
我想要类似下面列表的东西,但更大并且需要下载
{ "cmn" : ["Chinese", "官话"],
"es" :["Spanish", "español"],
"en": ["English", "English"],
...
"ru": ["Russian", "Русский"] }
最佳答案
不知道你要的东西是不是现成的。您可能需要自己创建它,从最大的语言开始,然后逐渐转向较小的语言。
这个问题有几个困难:
- 世界上有 6000-7000 种语言,但并非所有语言都有语言标签。
- 对发言人人数的估计总是有些过时,但有些估计比其他估计更过时。在查阅维基百科创建我的语言标签列表时,估计日期在 1990 年代初期和 2010 年之间。因此这些数字并不完全具有可比性。
- 对较小语言和没有官方地位的语言的估计通常非常粗略,有时甚至不存在。
- 一些语言标签,尤其是在 ISO 639-3 中,是“包含代码”,即它们标识语言组(例如中文)而不是单个语言。
- 对于某些语言,有时区分不同国家/地区使用的变体很有用,例如当您想区分比利时荷兰语或荷兰语的语音合成时。
您最初需要的只是 ISO 639-1 的列表语言标签(双字母代码),自 biggest languages都在那里有代表。对于较小的,您最终将需要 ISO 639-3 tags (三字母代码)。 IETF BCP 47建议您使用可用于特定语言的最短代码。 (因此,在您的示例中,中文的“cmn”将替换为“zh”、“zh-CN”、“zh-TW”或其他内容,具体取决于您想要的具体程度。)
无论如何,我现在的一个 GitHub 存储库中有一个 包含 400 多种语言的 JSON 文件。参见 http://cstrobbe.gitlab.io/languagelearning/misc/languagetags.json .
附言: 有关按字母顺序排列的 ISO 639-1 标签的 JSON 列表,请参阅 languages.js on GitHub .这些标签不按相应语言的母语使用者数量排序。 (并且 ISO 639-3 涵盖的许多语言不在 ISO 639-1 中。)
关于javascript - 根据母语人士的数量寻找一个好的 ISO 语言标签列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38295592/