mysql - dplyr 加入带有变音符号的 Mysql 数据

标签 mysql r dplyr

我什至不确定如何为此制定搜索。

在我的 MySQL 数据中,

SELECT "Anaïs"= "Anais"

产生“1”。该表采用 utf8mb4 编码,具有 general_ci 排序规则。 (而且我几乎不知道其中任何一个的实际含义。)所以在我的数据库中,这两个字符串是等价的。

但我将该数据提取到 R 脚本中,并使用 dplyr join 将其匹配到不同的表/数据框。在 R 中:

"Anaïs"== "Anais"

产生“假”。

此外,MySQL 不区分大小写,但在 R(DBI??)中,连接区分大小写。 (我的原始数据中有一堆拼写错误,其中的东西不小心没有大写,例如 Depaul 和 DePaul。)

解决此问题的最佳方法是什么?

谢谢。

最佳答案

stringi stri_trans_general 将拉丁文转换为 ASCII

library(stringi)
stri_trans_general('Anaïs','Latin-ASCII')=='Anais'
[1] TRUE

对于上层,使用toupper

关于mysql - dplyr 加入带有变音符号的 Mysql 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50337209/

相关文章:

php - 使用数组 php 更新 mysql 数据库字段

r - "Hmisc"软件包或 namespace 无法加载-没有名为'latticeExtra'的软件包

r - R 中带有 NA 的日期列 - 变异的意外行为

mysql - 使用 ORDER BY 子句如何提高和降低性能?

MySQL:选择最后 X 行,然后选择特定行

r - 将列表转换为 Tibble 并添加带有列表名称的列

r - 在绘图刻度线标签中组合 paste() 和 expression()

r - 如何在 R 中使用并发值求和

r - dplyr:按组减去与给定条件匹配的值

mysql - 当我尝试使用 MySQL 中的身份存储注册用户时出错