python - python 中的名称匹配

标签 python fuzzywuzzy name-matching

我们有一个第三方“工具”,可以查找相似名称并在两个名称之间分配相似度分数。

我应该尽可能模仿该工具的行为。 在网上搜索后,尝试了一下距离方法。已使用fuzzywuzzy对于同样的。

matches = process.extractBests(
    name, 
    choices, 
    score_cutoff=50, 
    scorer=fuzz.token_sort_ratio,
    limit=1 
);

它给出的结果接近工具结果。但是,很少有异常值 - 如下突出显示。

enter image description here

经过互联网上的进一步搜索,我了解到进一步的细化需要实现某种机器学习。我是机器学习领域的新手 - 因此寻求一些关于我下一步应该尝试进一步改进代码的建议。

谢谢!

最佳答案

看看这个包。它是为名字匹配量身定制的 HMNI Package

关于python - python 中的名称匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56327106/

相关文章:

python - 训练什么机器学习算法来使用特征权重作为决策树的输出?

python - 使用 fuzzywuzzy 在数据框中创建一列匹配结果

python - Pandas 模糊合并/匹配名称列,有重复项

grails - 在Grails中合并表格,Web服务数据

python - 日志记录中标准输出捕获的最大递归深度

python - sqlalchemy 恒等式映射问题

python - 在 Python 中用值对字符串进行分组

python - 不同长度的两个数据帧的列之间的余弦相似度?

python - 迭代 Pandas 数据框中的列表并总结其他列