php - 如何使 PHP like_text() 函数适用于日语字符(汉字、片假名和平假名)?

标签 php character-encoding cjk multibyte

我想使用 PHP 提供的用于日语字符的imilar_text() 函数。但不幸的是它给出了错误的答案。我怎样才能让它发挥作用?

例如: similar_text('土桥勇树', '东日刷株式') 给出输出 3,但我们可以清楚地看到它应该是 0

最佳答案

您将需要处理形成汉字字符的可能的多字节。我不是 100% 有信心,但我怀疑imilar_text 不支持 mb,而您需要一个可以支持的类似解决方案。

此链接显示人们尝试处理类似于 php 函数的 mb char。

https://gist.github.com/soderlind/74a06f9408306cfc5de9

https://github.com/antalaron/mb-similar-text

我没有亲自测试过这一点,但该方法可能是正确的,或者会激发您编写自定义函数。

另一篇文章中也介绍了:

how to use similar text php code in arabic

关于php - 如何使 PHP like_text() 函数适用于日语字符(汉字、片假名和平假名)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54302741/

相关文章:

javascript - 日文、英文标签(如 Twitter)的正则表达式

c++ - 如何确定普通话字符的 Levenshtein 距离?

php - 如何通过python设置php的$_GET和$_POST变量?

JavaScript - 如何从下拉选择中执行特定查询?

php - 如何在 SQL 中插入保留字为 "from"的记录?

php - 删除整个评论线程系列

MySQL从5.1更新后字符编码错误

python - 使用 MD5( ) 在 Python 中编码和解码

php - 使用 mb_substr() 管理韩语多字节字符串会产生乱码

vim - 如何用grep匹配汉字?