mysql 搜索前缀 "the"或 "and/&"歧义

标签 mysql data-mining

我正在尝试在 mysql 中跨两个不同的数据库进行标题搜索,以匹配来自不同来源的数据。 在 db1 或 db2 中,标题有时会在一个数据库中以“第一个标题”开头,而在另一个数据库中则以“第一个标题”开头,或者“遥远”与“遥远”。

Mysql 全文搜索在解决这个问题上似乎不是很有效。我目前只进行直接匹配“WHERE title1=title2”,但这当然会错过标题中存在细微差别的任何连接。

我想出的唯一解决方案是运行一系列 if 语句,检查两个标题中是否包含“the”或“&”。

这并不是一个可怕的方法,但我认为有一种更有效的方法来编写查询来处理这些问题。

有什么想法吗?到目前为止,我的网上搜索没有结果。 谢谢

最佳答案

您有预处理步骤吗?如果这样做,您可能会考虑在比较两个数据库之前对它们进行规范化。

关于mysql 搜索前缀 "the"或 "and/&"歧义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1034380/

相关文章:

algorithm - 强调实用细节的 C4.5 和 ID3 算法

javascript - 如何从存储在mysql中的多边形数据在HERE Map中绘制多边形

sql - 如何从多对多表中选择一条记录,其中一个 ID 存在于一个表中,而另一个表中不存在?

php - 终极表情符号编码方案

r - GBM R函数: get variable importance separately for each class

machine-learning - 语音识别方面有现有的研究可以区分不同人的声音吗?

mysql - "<>some"和 "not in"之间的区别

MySQL 查询 : merge result of many rows into 1 row

machine-learning - 我们怎么知道狄利克雷分布描述的是主题而不是其他东西?

python - 无法导出到 ".csv"文件 - pandas.DataFrame