postgresql - 如何在 PostgreSQL 数据库中处理多种人类语言？

如果数据库使用 UTF-8 编码，是否可以正确存储和检索所有人类语言的文本？

在处理 PostgreSQL 数据库中的非英语语言时是否存在任何“陷阱”？

使用 Ruby on Rails 和 PostgreSQL 9.1。

最佳答案

除了 Spidey 和 Kevin 的观点(在客户端使用 utf-8 和 ENCODING 'utf-8' 数据库，注意不同的归类)，我强烈建议用尽可能使用它所使用的语言。

如果您想使用全文搜索或任何类型的语言分析，了解每个字段使用的语言确实很有帮助。全文搜索不能进行词根分析等，除非它有字典和后缀列出被索引的文本 - 为此它需要知道语言。

存储ISO 639 language codes可能是一个合理的选择。

关于postgresql - 如何在 PostgreSQL 数据库中处理多种人类语言？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11906063/