我正在尝试构建一个数据库,其中包含来自 unicode 提供的 unihan.zip 文件的中文 unicode 数据。
但是该文件仅提供指定的十六进制代码点中的字符。 (例如“U+547D”)。
我的想法是手动将每个代码点(例如“U+547D”)转换为“命”,然后将其保存为 CSV UTF-8,以便使用 phpmyadmin 导入到 mysql,我知道这是可行的。
只是想知道 phpmyadmin 或 mysql 是否能够接受这种十六进制代码点格式作为导入此数据的更直接的方式?
我已经搜索了很多这个答案,但没有找到任何答案。我还尝试以多种方式导入它,例如使用 char 函数,但表仅更新为“0x547D”而不是“命”。
对此的任何见解和帮助将不胜感激。
最佳答案
您可能需要使用 PHP 将“0x547D”转换为十进制,然后创建一个 utf-8 格式的字符(如“命”),然后将数据保存到数据库中。如果是这样,请查看 portable-utf8.php 库,其中包含 utf8_chr() 函数。
顺便说一句,谢谢您让我了解 unihan.zip...我一直在寻找免费且良好的汉字源。
关于php - 使用phpmyadmin将Unicode十六进制代码点数据导入mysql,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25641099/