php - ISO-8859-1 字符截断插入到 utf-8 mysql 列中的文本

标签 php mysql encoding utf-8 iconv

所以我遇到了一个奇怪的截断问题!找不到关于此的具体答案。

所以基本上,明显的 ISO 字符 ½ 存在问题,它会在插入到指定 UTF-8 的列时截断文本的其余部分。

假设我的字符串是:“You need to add ½ cup of water.” MySQL 会将其截断为“您需要添加”

如果我:

print iconv("ISO-8859-1", "UTF-8//IGNORE", $text);

然后输出:

½

哦哦

好吧,这行不通,因为我需要 1/2 本身。如果我转到 phpMyAdmin 并将句子复制并粘贴并提交,它就像一个魅力一样工作,因为整个字符串都在那里,只有一半符号和剩余文本!出了点问题,我对它是什么感到困惑。我知道这可能会影响其他角色,因此需要解决潜在的问题。

我使用的语言是 php,文件本身编码为 UTF-8,我引入的数据的内容类型设置为 ISO-8859-1。该列是 utf8_general_ci 并且所有 mysql 字符集在 php 中设置为 UTF-8:“SET character_set_result = 'utf8', etc...”

最佳答案

您的代码中有些地方没有将字符串作为 UTF8 处理。它可能是您的 PHP/HTML,它可能在您与数据库的连接中,或者它可能是数据库本身 - 所有内容都必须始终设置为 UTF8,如果不是,字符串将被截断查看何时跨越 UTF8/非 UTF8 边界。

我假设您的数据库符合 UTF8 标准——这是最容易检查的。请注意,可以在服务器级别、数据库级别、表级别和表内的列级别设置排序规则。在列上设置 UTF8 归类应该覆盖存储的任何其他内容,但如果其他内容不是 UTF8,则在与数据库交谈时仍会起作用。如果不确定,请在打开后明确将连接设置为 UTF8:

$dbh->setAttribute(PDO::MYSQL_ATTR_INIT_COMMAND, "SET NAMES 'utf8'");

现在您的数据库和连接是 UTF8,确保您的网页也是。同样,这可以在多个地方设置(.htaccess、php.ini)。如果您不确定/没有访问权限,只需覆盖页面顶部默认选择的任何 PHP:

<?php ini_set('default_charset', 'UTF-8'); ?>

请注意,在从页面输出任何文本之前,您需要在开始时执行上述操作。输出文本后,尝试指定编码可能为时已晚 - 您可能已经被锁定在服务器上的默认设置中。然后我还在我的标题中重复这个(可能是矫枉过正):

<head>
<meta charset="UTF-8">
<meta http-equiv="Content-type" content="text/html; charset=UTF-8">
</head>

我也在获取数据的表单上覆盖了它:

<FORM NAME="utf8-test" METHOD="POST" ACTION="utf8-test.php" enctype="multipart/form-data" accept-charset="UTF-8">"

老实说,如果您将编码设置在顶部,我的理解是不需要其他覆盖 - 但我还是保留了它们,因为它也不会破坏任何东西,我宁愿只需明确说明编码,而不是让服务器做出假设。

最后,您提到在 phpMyAdmin 中插入了字符串并且它看起来符合预期 - 您确定 phpMyAdmin 页面是 UTF8 格式吗?我不认为他们是。当我从我的 PHP 代码中存储 UTF8 数据时,它看起来像 phpMyAdmin 中的原始 8 位字符。如果我采用相同的字符串并将其直接存储在 phpMyAdmin 中,它看起来是“正确的”。所以我猜 phpMyAdmin 使用的是本地服务器的默认字符集,不一定是 UTF8。

例如,从我的网页中存储的以下字符串:

I can¹t wait

在我的 phpMyAdmin 中是这样读的:

I can’t wait

因此,以这种方式进行测试时要小心,因为您并不真正了解 phpMyAdmin 用于显示或数据库连接的编码。

如果您仍然遇到问题,请尝试下面我的代码。首先,我创建一个表来存储 UTF8 格式的文本:

CREATE TABLE IF NOT EXISTS `utf8_test` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `my_text` varchar(8000) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=MyISAM  DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ;

这里有一些 PHP 来测试它。它基本上接受您在表单上的输入,将输入回显给您,然后从数据库中存储/检索文本。就像我说的,如果您直接在 phpMyAdmin 中查看数据,您可能会发现它看起来并不正确,但是通过下面的页面,它应该总是按预期显示,因为页面和数据库连接都被锁定为 UTF8。

<?php
  // Override whatever is set in php.ini
  ini_set('default_charset', 'UTF-8');

  // The following should not be required with the above override
  //header('Content-Type:text/html; charset=UTF-8');

  // Open the database
  $dbh = new PDO('mysql:dbname=utf8db;host=127.0.0.1;charset=utf8', 'root', 'password');

  // Set the connection to UTF8
  $dbh->setAttribute(PDO::MYSQL_ATTR_INIT_COMMAND, "SET NAMES 'utf8'");
  // Tell MySql to do the parameter replacement, not PDO
  $dbh->setAttribute(PDO::ATTR_EMULATE_PREPARES, false);
  // Throw exceptions (and break the code) if a query is bad
  $dbh->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);

  $id = 0;
  if (isset($_POST["StoreText"]))
  {
    $stmt = $dbh->prepare('INSERT INTO utf8_test (my_text) VALUES (:my_text)');
    $stmt->execute(array(':my_text' => $_POST['my_text']));
    $id = $dbh->lastInsertId();
  }
?>

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional/EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta charset="UTF-8">
<meta http-equiv="Content-type" content="text/html; charset=UTF-8">

<title>UTF-8 Test</title>
</head>

<body>

<?php
  // If something was posted, output it
  if (isset($_POST['my_text']))
  {
    echo "POSTED<br>\n";
    echo $_POST['my_text'] . "<br>\n";
  }

  // If something was written to the database, read it back, and output it
  if ($id > 0)
  {
    $stmt = $dbh->prepare('SELECT my_text FROM utf8_test WHERE id = :id');
    $stmt->execute(array(':id' => $id));
    if ($result = $stmt->fetch())
    {
      echo "STORED<br>\n";
      echo $result['my_text'] . "<br>\n";
    }
  }

  // Create a form to take some user input
  echo "<FORM NAME=\"utf8-test\" METHOD=\"POST\" ACTION=\"utf8-test.php\" enctype=\"multipart/form-data\" accept-charset=\"UTF-8\">";

  echo "<br>";

  echo "<textarea name=\"my_text\" rows=\"20\" cols=\"90\">";

  // If something was posted, include it on the form
  if (isset($_POST['my_text']))
  {
    echo $_POST['my_text'];
  }

  echo "</textarea>";

  echo "<br>";
  echo "<INPUT TYPE = \"Submit\" Name = \"StoreText\" VALUE=\"Store It\" />";

  echo "</FORM>";
?>
<br>

</body>

</html>

关于php - ISO-8859-1 字符截断插入到 utf-8 mysql 列中的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18138097/

相关文章:

mysql - 无法使用 exec 写入文件

linux - 在没有交互模式的情况下执行 vim 命令

java - 如何将 Java 图像转换为 JPEG 字节数组?

php - 保持变量在函数之间保持不变

php - Laravel 更新要求在保存到数据库之前填写所有输入

php - 为什么这些 UPDATE 和 INSERT INTO 查询不起作用? PHP 和 MySQL

c# - 如何使用 Encoding.GetString 处理大量数据? (抛出 OutOfMemoryException)

php - 数组在 foreach 中不断重复

尝试使用 stat() 或 filemtime() 时出现 PHP 警告

php - 在 PHP 文件中显示 MySQL 的 DIV 的位置