mysql - 在MYSQL中查找具有不同拼写的重复记录

标签 mysql database drupal

  1. 我有包含字段 name_entry 的记录,例如 udhaya、udaya、udhaya kumar、uthaya。但这四个人都是同一个人,实际咒语是 udhaya kumar。
  2. 在这种情况下我需要找到人员记录并将重复项更新为原始记录
  3. 我有超过 20000 条记录,其中至少 300 条记录有类似的重复项。 我需要针对这种情况的解决方案。

提前谢谢您..

最佳答案

在数据库级别,无法确定相似的拼写(拼写错误)单词。

但是,很少有自然语言处理库 - 斯坦福 NLP( Stanford_NLP )、Apache Open NLP( Open NLP )等 - 名称实体识别可以扩展,训练自定义模型。您可以从中对相似拼写的单词进行分组并删除重复项。这很复杂,而且结果的准确性取决于模型的训练程度。

但是,从你的问题来看,这是实现的唯一方法。

关于mysql - 在MYSQL中查找具有不同拼写的重复记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41608379/

相关文章:

mysql - 在 where 子句中使用带有 'union' 和 'in' 的 MySQL group_concat 函数

PHP 函数循环 SQL 结果并生成 HTML 表

php - 使用php从数据库列中删除逗号分隔值的函数

mysql - 在字符串中查找表的数据

mysql - 错误 2003 (HY000) : Can't connect to MySQL server on '....' (65)

Drupal 7 - 将图像添加到 node.tlp.php 主题文件

mysql - 使用两个表计算每个用户的点赞数

c# - "SqlParameterCollection only accepts non-null SqlParameter type objects, not String objects"

css - Drupal - 需要更改框内容

php - 在 Drupal 上连接数据库表