如果数据库使用 UTF-8 编码,是否可以正确存储和检索所有人类语言的文本?
在处理 PostgreSQL 数据库中的非英语语言时是否存在任何“陷阱”?
使用 Ruby on Rails 和 PostgreSQL 9.1。
最佳答案
除了 Spidey 和 Kevin 的观点(在客户端使用 utf-8 和 ENCODING 'utf-8'
数据库,注意不同的归类),我强烈建议用尽可能使用它所使用的语言。
如果您想使用全文搜索或任何类型的语言分析,了解每个字段使用的语言确实很有帮助。全文搜索不能进行词根分析等,除非它有字典和后缀列出被索引的文本 - 为此它需要知道语言。
存储ISO 639 language codes可能是一个合理的选择。
关于postgresql - 如何在 PostgreSQL 数据库中处理多种人类语言?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11906063/