php - 存储数据的奇怪字符编码,旧脚本显示它们很好,新脚本没有

标签 php mysql database codeigniter character-encoding

我正在尝试重写一个旧网站。
它是波斯语,使用波斯语/阿拉伯语字符。

CREATE DATABASE `db` DEFAULT CHARACTER SET utf8 COLLATE utf8_persian_ci;
USE `db`;

我几乎所有的表/列 COLLATE 都设置为 utf8_persian_ci

我正在为我的新脚本使用 codeigniter

'char_set' => 'utf8',
'dbcollat' => 'utf8_persian_ci',

在数据库设置里,所以那里没有问题。

所以这是奇怪的部分

旧脚本使用某种名为 TUBADBENGINETUBA DB ENGINE 的数据库引擎……没什么特别的。

当我使用旧脚本在数据库(波斯语)中输入一些数据时,当我查看数据库时,字符存储为 عمران

旧脚本获取/显示数据正常,但新脚本显示它们使用与数据库相同的奇怪字体/字符集

所以当我输入 اااا 时,数据库存储的数据看起来像 عمرا٠,当我在新脚本中获取它时,我看到 ع٠…را٠但在旧脚本中我看到 اااا

CREATE TABLE IF NOT EXISTS `tnewsgroups` (
  `ID` int(11) NOT NULL AUTO_INCREMENT,
  `fName` varchar(200) COLLATE utf8_persian_ci DEFAULT NULL,
  PRIMARY KEY (`ID`)
) ENGINE=InnoDB  DEFAULT CHARSET=utf8 COLLATE=utf8_persian_ci AUTO_INCREMENT=11 ;

--
-- Dumping data for table `tnewsgroups`
--

INSERT INTO `tnewsgroups` (`ID`, `fName`) VALUES
(1, 'عمران'),
(2, 'معماری'),
(3, 'برق'),
(4, 'مکانیک'),
(5, 'test'),
(6, 'test2');

另一方面,当我直接在数据库中输入 ااااا

当然我在数据库中存储了相同的اااا

新脚本显示正常

但在旧脚本中我得到 ????

任何人都可以理解这一点吗?

这是大号引擎

https://github.com/maxxxir/mz-codeigniter-crud/blob/master/tuba.php

旧脚本的用法示例:

define("database_type" , "MYSQL");
define("database_ip" , "localhost");
define("database_un" , "root");
define("database_pw" , "");
define("database_name" , "nezam2");
define("database_connectionstring" , "");
$db = new TUBADBENGINE(database_type , database_ip , database_un , database_pw , database_name , database_connectionstring);
$db->Select("SELECT * FROM tnews limit 3");
if ($db->Lasterror() != "") { echo "<B><Font color=red>ÎØÇ ! áØÝÇ ãÌÏøÏÇ ÊáÇÔ ˜äíÏ";  exit(); }
for ($i = 0 ; $i < $db->Count() ; $i++) {
    $row = $db->Next();
    var_dump($row);
}

最佳答案

简而言之,因为这已经被讨论了一千次了:

  1. PHP 保存一个字符串,例如 "汉字",以 UTF-8 编码。此字节为 E6 BC A2 E5 AD 97
  2. 它通过设置为 latin1数据库连接发送此字符串。
  3. 数据库接收字节 E6 BC A2 E5 AD 97,认为它们代表 latin1 字符。
  4. 数据库存储字符æ¼¢å(E6 BC A2 E5 AD 97映射到latin1中的字符)。<
  5. 相反的相同过程使 PHP 接收相同的字节,然后将其视为 UTF-8。对于 PHP,往返工作正常,即使数据库没有按应有的方式处理字符。

所以这里的问题是在数据入库的时候数据库连接设置错误。您必须将数据库中的数据转换为正确的字符。试试这个:

SELECT CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) FROM table_name

也许 utf8 不是您在这里需要的,试验一下。如果可行,将其更改为 UPDATE 语句以永久更新数据。

关于php - 存储数据的奇怪字符编码,旧脚本显示它们很好,新脚本没有,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20237474/

相关文章:

java - 自动增量 ID java db

PHP、MYSQL、Echo 在单列中循环行

php mysql date.utc 并统计出现次数

mysql - 如何将一个表左连接n次?如果可能的话,使用 ZendDb?

javascript - 如何向每个用户显示自定义数量的 SVG 圆圈?

python - 如何重新采样并将每个索引四舍五入到最接近的秒数?

php - 解析xml到mysql

php - 返回 false 的回调函数 CodeIgniter

php - 漂亮链接中的撇号和冒号

php - Doctrine :使用子查询生成树路径