javascript - 根据母语人士的数量寻找一个好的 ISO 语言标签列表

标签 javascript json internationalization iso

我正在寻找一个包含语言代码和相应语言的语言名称的文件。如果列表按母语人士的数量排序,那就太好了。

我想要类似下面列表的东西,但更大并且需要下载

{ "cmn" :  ["Chinese", "官话"],
 "es" :["Spanish", "español"],
 "en": ["English", "English"],
 ... 
"ru": ["Russian", "Русский"] }

最佳答案

不知道你要的东西是不是现成的。您可能需要自己创建它,从最大的语言开始,然后逐渐转向较小的语言。

这个问题有几个困难:

  • 世界上有 6000-7000 种语言,但并非所有语言都有语言标签。
  • 对发言人人数的估计总是有些过时,但有些估计比其他估计更过时。在查阅维基百科创建我的语言标签列表时,估计日期在 1990 年代初期和 2010 年之间。因此这些数字并不完全具有可比性。
  • 对较小语言和没有官方地位的语言的估计通常非常粗略,有时甚至不存在。
  • 一些语言标签,尤其是在 ISO 639-3 中,是“包含代码”,即它们标识语言​​组(例如中文)而不是单个语言。
  • 对于某些语言,有时区分不同国家/地区使用的变体很有用,例如当您想区分比利时荷兰语或荷兰语的语音合成时。

您最初需要的只是 ISO 639-1 的列表语言标签(双字母代码),自 biggest languages都在那里有代表。对于较小的,您最终将需要 ISO 639-3 tags (三字母代码)。 IETF BCP 47建议您使用可用于特定语言的最短代码。 (因此,在您的示例中,中文的“cmn”将替换为“zh”、“zh-CN”、“zh-TW”或其他内容,具体取决于您想要的具体程度。)

无论如何,我现在的一个 GitHub 存储库中有一个 包含 400 多种语言的 JSON 文件。参见 http://cstrobbe.gitlab.io/languagelearning/misc/languagetags.json .

附言: 有关按字母顺序排列的 ISO 639-1 标签的 JSON 列表,请参阅 languages.js on GitHub .这些标签不按相应语言的母语使用者数量排序。 (并且 ISO 639-3 涵盖的许多语言不在 ISO 639-1 中。)

关于javascript - 根据母语人士的数量寻找一个好的 ISO 语言标签列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38295592/

相关文章:

javascript - 当鼠标悬停在网页上的文本时突出显示映射图像的部分

javascript - 防止 Galleriffic jquery 插件重新加载同一图像两次

c# - Web 请求内容类型总是 text/html

javascript - 如何检查Javascript对象的子节点是否包含数组

internationalization - Angular 7 i18n 在服务、组件和没有模板的情况下翻译

javascript - post 参数未传递 zend 框架 2

javascript - 在实例化指令 Controller 之前,如何扩充隔离指令范围?

string - 原型(prototype)中的 JSON 到字符串

php - preg_match unicode 不适用于某些语言

java - Spring 中的 LocaleResolver