ruby-on-rails-3 - Heroku PG Dump 导出和 PSQL 导入 -> 扩展 ASCII 字符的双重编码

标签 ruby-on-rails-3 postgresql heroku encoding

我继承了一个 Heroku Rails 应用程序,我正在尝试将其迁移到我的开发环境中。

Heroku 运行 PG 9.1.9,Local 运行 PG 9.2.4。 Rails 3.2.11,pg gem '0.13.2',本地操作系统 Debian 7。

Heroku 数据库信息:

$psql -l "dbname=abc... user=aaa etc"
  Name |  Owner | Encoding |   Collate   |    Ctype    |   Access 
 ---------------+----------+-------------+-------------+-------------+-----------------------
abcdef | abcdef | UTF8     | en_US.UTF-8 | en_US.UTF-8 | abcdef=CTc/abcdef

据我所知,生产 PG 数据库使用 UTF8 编码。

从 Heroku 导出:

pg_dump -C "dbname=abc... user=aaa etc" > dump_plain.sql

我使用了 pg_dump -C 选项来确保根据转储文件重新创建数据库,以避免在我手动创建目标数据库时出现编码问题。

Heroku 数据库

$head dump_plain.sql
--
-- PostgreSQL database dump
--

SET statement_timeout = 0;
SET client_encoding = 'UTF8';
SET standard_conforming_strings = off;
SET check_function_bodies = false;
SET client_min_messages = warning;
SET escape_string_warning = off;

然后我编辑 dump_plain.sql 以更改数据库名称和所有者,然后通过以下方式导入:

psql < dump_plain.sql

没有报告错误。

$psql -l
      Name       |  Owner   | Encoding |   Collate   |    Ctype    |   Access 
 ----------------+----------+----------+-------------+-------------+-----------------------
  imported_d     | only_me  | UTF8     | en_US.UTF-8 | en_US.UTF-8 | 

PSQL 报告两个数据库的编码相同,并且 Rail 的 database.yml,据我所知,应该使用相同的编码。

Rails 数据库.yml:

development:
  adapter: postgresql
  database: stm_test
  encoding: utf8

出于某种原因,在从新导入的数据库运行 Rails3 webapp 时,扩展的 ASCII 字符(例如省略号 (...))会被双重编码。

截图说明:

本地开发双重编码 Double Encoding

在 Heroku 上正确编码 Shows Correctly on Production

此数据存储为 TEXT 列:

CREATE TABLE templates (
    id integer NOT NULL,
    screen_writer text, <---- stored here
    action_list text
);

本地的 psql 选择片段

label: "\"\xE2\x80\xA6I was proud of having\xE2\x80\xA6\"" 

Heroku 上的 psql 选择片段(通过 heroku pg:psql > 选择 ....)

label: "\"\xE2\x80\xA6I was proud of having\xE2\x80\xA6\"" 

查看 json 片段:

production: "label":"\"\u2026I was proud of having\u2026\""
local: "label":"\"\u00e2\u0080\u00a6I was proud of having\u00e2\u0080\u00a6\""

注意附加的\u00。问题是否与服务器的 postgres 客户端编码设置有关?

Local dev 上的 LOCALE 设置与 Heroku 的匹配:

$locale
LANG=en_US.UTF-8
LANGUAGE=
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=

我觉得我错过了一个简单的步骤,如果有人能在正确的方向上插入我,我将永远感激不已。

最佳答案

解决方法:

添加到 Rails.root/config/boot.rb

require 'yaml'
YAML::ENGINE.yamler = 'syck' 

关于ruby-on-rails-3 - Heroku PG Dump 导出和 PSQL 导入 -> 扩展 ASCII 字符的双重编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18078436/

相关文章:

ruby-on-rails-3 - ActiveRecord 查询对我的小脑袋来说太难了

sql - 从表中选择不同的值并添加 'count' 列

sql - 如何找到通过外键引用特定行的表?

postgresql - Rails 4 - postgresql 9.4 jsonb 不存在

postgresql - 如何在 CentOS 上运行 pg_ctlcluster?

python - Heroku 计划任务每​​ 10 分钟运行一次,每小时计划一次

ruby-on-rails - Rails 3 获取嵌套记录

ruby-on-rails - 这个 rails 3 .build 方法到底在做什么?

laravel - 如何在 Heroku 中设置 Laravel 5 的任务调度?

javascript - 尝试使用 Express.js 和 Jade 从 MongoDB 数据库中删除条目