ruby-on-rails - postgres unaccent 函数 vs RoR 音译

标签 ruby-on-rails postgresql unaccent

在我们的 RoR 项目中,我们使用 postgres unaccent 函数来检索我们模型名称属性之一的非重音版本。 name 属性可以包含来自各种语言的任何重音字符。然后我们将其保存为 unaccent_name 属性。我不喜欢这个解决方案,因为我们需要确保安装并可访问 postgres 扩展 UNACCENT(在测试、移动/清理数据库等时)。

在 RoR 中有 ActiveSupport::Inflector.transliterate 方法,它应该做一些非常相似的事情。

我发现它大多数情况下以相同的方式翻译重音字符,但也有一些区别:

相同的结果:

SELECT unaccent('ľščťžý') AS unaccent_name;
=> "lsctzy"
ActiveSupport::Inflector.transliterate('ľščťžý')
=> "lsctzy"

不同的结果:

SELECT unaccent('ß') AS unaccent_name;
=> "S"
ActiveSupport::Inflector.transliterate('ß')
=> "ss"

我知道这两种方法都可以接受带有自定义字母替换的字典,但我只对它们的一般/默认用法感兴趣。

音译方法的主要目的与postgres unaccent功能相同吗?我们可以用它来代替吗?

最佳答案

非常古老的帖子,但我正在解决与 OP 类似的问题。我们希望能够搜索姓名并进行音译以提供更好的结果。但是,对于我们的 Postgres 和 rails 版本,该字符将相同的音译为“ss”。

只是想分享我的发现,以防它对偶然发现这篇文章的其他人有用。

在 Rails 5.2 中:

irb(main):001:0> ActiveSupport::Inflector.transliterate('ß')
=> "ss"

在 postgres 9.6 中我得到:

db-test=# SELECT unaccent('ß') AS unaccent_name;
 unaccent_name 
---------------
 ss
(1 row)

关于ruby-on-rails - postgres unaccent 函数 vs RoR 音译,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39538015/

相关文章:

ruby-on-rails - 不要以 root 身份运行 Bundler - Elastic Beanstalk 上的 Rails6

ruby-on-rails - 在 Postgres 中复制 Rails 时区 "magic"

PostgreSQL:如何从命令行传递参数?

ruby-on-rails - :default => 0 and :null => false differ for integer fields in migrations? 怎么办

ruby-on-rails - 在 Rails 中将 Devise 身份验证助手与 `OR` 语句相结合

postgresql - 如何在 postgresql 中创建位图索引? (它甚至有位图索引吗?)

PostgreSQL 转储/恢复

postgresql - 具有超过 1 个变音符号的字符的 Postgres UNACCENT

postgresql - unaccent() 不适用于 plpgsql 动态查询中的希腊字母

postgresql - 在 PostgreSQL 上创建 unaccent 扩展时出错