mysql - 搜索名称数据库

标签 mysql database search

我有一个包含大量人员姓名的 MYSQL 数据库。数据库中的每个人都可以有以下一种或所有姓名类型:名字、姓氏、中间名、娘家姓或昵称。我想为人们提供一种搜索此数据库的方法,以查看数据库中是否存在某个人。

是否有适合搜索人名数据库的现成产品?

最佳答案

只要有一点独创性,MySQL 就会满足您的需要...下面给出了一些如何实现这一点的想法。

Your table: (I call it tblPersons)
   PersonID   (primary key of sorts)
   First
   Last
   Middle
   Maiden
   Nick
   Other columns for extra info (address, whatever...)

By keeping the table as-is, and building an index on each of the name-related columns, the following query provides an inefficient but plausible way of finding all persons whose name matches somehow a particular name. (Jack in the example)

SELECT * from tblPersons
WHERE First = 'Jack' OR Last = 'Jack' OR Middle = 'Jack' 
  OR Maiden = 'Jack' OR Nick = 'Jack'

请注意,应用程序并不仅限于在所有各种名称类型中搜索要查找的一个名称值。用户还可以输入一组特定的条件,例如搜索名字“John”和姓氏“Lennon”以及职业“艺术家”(如果此类信息存储在数据库中)等。

此外,请注意,即使使用这种单表方法,您的应用程序的功能之一可能是让用户告诉搜索逻辑这是否是“给定”的名字(如 Paul, Samantha 或 Fatima)或“姓氏”(例如 Black、McQueen 或 Dupont)。这样做的主要目的是有些名字可以是(例如刘易斯或希拉里),并且可以选择在查询中更具体一些,最终用户可以让 SQL 自动清除许多不相关的记录.我们将在替代的、更高效的数据库布局的上下文中回到这种功能。

引入“名称”表。 我们可以引入一个额外的表,而不是(或另外...)将各种名称存储在 tblPersons 表中。并将其与 tblPersons 相关联。

tblNames
  PersonID   (used to relate with tblPersons)
  NameType   (single letter code, say F, L, M, U, N for First, Last...)
  Name

然后我们会在 tblPersons 中为每个人创建一条记录,但在 tblNames 中的记录与他们的名字一样多(但是当他们没有特定的名字时,例如很少有人有昵称,就没有必要用于 tblNames 中的相应记录)。

那么查询就变成了

SELECT [DISTINCT] * from tblPersons P
JOIN tblNames N ON N.PersonID = P.PersonID
WHERE N.Name = 'Jack'

这样的布局/结构会更有效率。此外,这个查询将有助于自己轻松地提供“给定”与“姓氏”的能力,只需添加到 WHERE 子句

      AND N.NameType IN ('F', 'M', 'N')  -- for the "given" names
  (or)
      AND N.NameType IN ('L', 'U', 'N')  -- for the "surname" types.  Note that
        -- we put Nick name in there, but could just as eaily remove it.

这种方法的另一个好处是它允许在其中存储其他类型的名称,例如可以添加每个名称的 SOUNDEX 形式,在它们自己的 NameType(s) 下,允许即使拼写是近似的,也可以轻松找到名称。

最后,另一个改进可能是引入一个单独的查找表,其中包含最常见的名字缩写(Pete 代表 Peter,Jack 代表 John,Bill 代表 William 等),并使用这个用于搜索目的(用于提供显示值的名称列将保留源数据中提供的内容,但搜索级别的额外查找/规范化会增加召回率)。

关于mysql - 搜索名称数据库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1457722/

相关文章:

MySql:比较 2 个字符串是数字?

python - 修复 python Sqlalchemy 模型无法插入 mysql 语法错误

asp.net - 如何使用 lucene.net 搜索 GUID

java - 在 Java 中查找给定对话框源代码的有效方法

linux - 从一个更大的二进制文件中寻找一个大的二进制值

mysql - 在 MySQL 中存储配置的最佳方式

mysql - 在 MySQL 中计算时区的偏移量

mysql - 如何从 mysql 中 Golang 的 GORM 中的查询中提取数据?

python记录到数据库

database - 表格规范化 (BCNF)