我知道有很多类似的问题,但在这种情况下没有一个建议的解决方案有效。
我在页面上有一个 PHP 变量,初始化为:
$hometeam="Крылья Советов"; //Cyrrilic string
当我在页面上打印出来时,它打印正确。所以 echo $hometeam
显示字符串 Крылья Советов,这是它应该的。
header中的content meta标签设置如下:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=UTF-8">
而且,在页面的最开头,我有以下内容(如我在搜索中找到的解决方案之一所建议的那样):
ini_set('default_charset', 'utf-8');
这样就可以了。
我试图将其保存到的 MySQL 表以及相关列的编码为 utf8_bin。当我转到 phpMyAdmin 并手动输入 Крылья Советов 时,它会正确保存在该字段中。
但是,当我尝试通过页面上的查询保存它时,使用以下基本查询:
mysql_query("insert into tablename (round,hometeam) values ('1','$hometeam') ");
mysql 条目如下所示:
c390c5a1c391e282acc391e280b9c390c2bbc391c592c391c28f20c390c2a1c390c2bec390c2b2c390c2b5c391e2809ac390c2bec390c2b2
那么这里发生了什么?如果页面上一切正常,MySQL本身也一切正常,问题出在哪里?有什么我应该添加到查询本身以使其保持字符串 UTF-8 编码的东西吗?
请注意,我在连接到数据库后设置了 mysql_set_charset('utf8');
(在页面顶部)。
编辑:运行查询 SHOW VARIABLES LIKE "%character_set%"
给出以下结果:
Variable_name Value
character_set_client utf8
character_set_connection utf8
character_set_database latin1
character_set_filesystem binary
character_set_results utf8
character_set_server latin1
character_set_system utf8
character_sets_dir /usr/share/mysql/charsets/
似乎这里可能有些东西,因为该列表中有 2 个 latin1。你怎么看?
另外,当我直接在 phpMyAdmin 中输入一个西里尔字符串时,一开始它看起来很好(在我保存后它显示正确)。但是重新加载表格,它像插入的一样以十六进制显示。对于问题中有关此的错误信息,我深表歉意。事实证明,这应该意味着问题出在 phpMyAdmin 或数据库本身。
编辑 #2:这是 show create table tablename
返回的内容:
CREATE TABLE `tablename` ( `id` int(11) NOT NULL AUTO_INCREMENT, `round` int(11), `hometeam` varchar(32) COLLATE utf8_bin NOT NULL, `competition` varchar(32) CHARACTER SET latin1 NOT NULL DEFAULT 'Russia', PRIMARY KEY (`id`)) ENGINE=MyISAM AUTO_INCREMENT=119 DEFAULT CHARSET=utf8 COLLATE=utf8_bin
最佳答案
你在 phpMyAdmin
中得到这个十六进制字符串了吗?我想当您通过例如 SELECT
插入的值时PHP
或 MySQL
控制台客户端,您将获得预期的西里尔 UTF8 字符串。
如果是这样,那是 phpMyAdmin 的配置问题,参见例如这里:http://theyouri.blogspot.ch/2010/12/phpmyadmin-collated-db-in-utf8bin-shows.html
phpMyAdmin collated db in utf8_bin shows hex data instead of UTF8 text
$cfg['DisplayBinaryAsHex'] = false;
此外,请不要那样使用 mysql_query
,因为您对 SQL 注入(inject)完全开放。我也不确定您是否真的想使用 utf8_bin,请参见例如本次讨论:utf8_bin vs. utf_unicode_ci或者这个:UTF-8: General? Bin? Unicode?
编辑 发生了一些奇怪的事情。如果将给定的十六进制字符串转换为 UTF8 字符,您将得到:“ÐšÑ€Ñ‹Ð»ÑŒÑ Ð¡如果你utf8_decode
这个,你会得到想要的“Крылья Советов”。所以,它似乎至少是 utf8 编码的两次(除了它在某处显示为十六进制字符的问题)。
能否请您提供完整的脚本?你在任何地方utf8_encode
你的字符串吗?如果您的脚本是这样的并且只有这样(除了有效的、打开的 MySQL 连接之外):
<?php
$hometeam="Крылья Советов"; //Cyrrilic string
// open mysql connection here
mysql_set_charset('utf8');
mysql_query("INSERT INTO tablename (round, hometeam) VALUES ('1', '$hometeam')");
$result = mysql_query("SELECT * FROM tablename WHERE round = '1'");
$row = mysql_fetch_assoc($result);
echo $row['hometeam'];
?>
然后你调用页面,结果是什么(在浏览器的页面源中,而不是浏览器中显示的)?
此外,请检查如果将排序规则更改为 utf8_unicode_ci 会发生什么,如此处另一个答案中所建议的那样。这至少涵盖了显示二进制数据时的 phpMyAdmin 问题,并且无论如何都是您想要的(因为您可能希望 ORDER BY
子句按预期执行,请参阅我上面链接的 SO 问题中的讨论)。
EDIT2 也许您还可以提供一些片段,例如 SHOW CREATE TABLE tablename
或 SHOW VARIABLES LIKE "%character_set%"
。可能有帮助。
关于php - 使用 UTF-8 编码的页面使用 UTF-8 编码将数据发送到 MySQL,但条目被打乱,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17552986/