postgresql - 如何在 PostgreSQL 数据库中处理多种人类语言?

标签 postgresql utf-8 character-encoding

如果数据库使用 UTF-8 编码,是否可以正确存储和检索所有人类语言的文本?

在处理 PostgreSQL 数据库中的非英语语言时是否存在任何“陷阱”?

使用 Ruby on Rails 和 PostgreSQL 9.1。

最佳答案

除了 Spidey 和 Kevin 的观点(在客户端使用 utf-8 和 ENCODING 'utf-8' 数据库,注意不同的归类),我强烈建议用尽可能使用它所使用的语言。

如果您想使用全文搜索或任何类型的语言分析,了解每个字段使用的语言确实很有帮助。全文搜索不能进行词根分析等,除非它有字典和后缀列出被索引的文本 - 为此它需要知道语言。

存储ISO 639 language codes可能是一个合理的选择。

关于postgresql - 如何在 PostgreSQL 数据库中处理多种人类语言?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11906063/

相关文章:

postgresql - 将 Google CloudSQL Postgres 数据库连接到 Data Studio

node.js - Sequelize.js 使用 PostgreSQL 进行一对多设计的最佳实践

c++ - 如何将重音字符从命令行转换为 wstring?

python - Django: DatabaseError: near "񐁓񐁌��...��1": 语法错误

node.js - pg-promise UTF 连接字符串

Java Jersey : Receive form parameter as byte array

sql - postgres 中数组的向量算术

sql-server - RDBMS 和 ORDBMS 之间的区别

Python 编码 - 有任何解释吗?

python - 在 Python 3 中使用带有多个文件的 gzip 存档