python - pandas 和 fuzzywuzzy 匹配百分比未正确

标签 python pandas fuzzywuzzy

我正在尝试使用 fuzzywuzzy 列来匹配。

我的代码是:

merged_file['ratio']=fuzz.ratio(merged_file.iloc[:,7], merged_file.iloc[:,33])

无论我尝试从一列到另一列匹配什么,但每列的比率始终相同。 例如

Here is the sample data set

以上应为 0, 100, 100 和 0, 100, 100

最佳答案

试试这个:

merged_file['ratio'] = [fuzz.ratio(a, b) 
                        for a, b in zip(merged_file.iloc[:,7], merged_file.iloc[:,33])]

它使用列表理解来计算两列中每对变量的 fuzz.ratio。 ab 只是临时变量,仅存在于列表理解本身的范围内。

关于python - pandas 和 fuzzywuzzy 匹配百分比未正确,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36701253/

相关文章:

python - 使用 python 重复数据删除库进行模糊重复检查错误

python - Pyspark levenshtein 连接错误

python - 如何在Python中每次跳过文件中的一行?

python - 从 Scipy 过滤器设计构建 SymPy 有理函数

python - 拆分具有固定宽度的 *.dat 文件,每个宽度已知

python - 创建 pandas 数据框,用循环重复条目

python - 比较列表中的项目并找到相似性

python - nginx 如何与运行 Flask 应用程序的 uWSGI 配合使用?

python - 如何在 Linux/Raspberry Pi 中将 .py 文件转换为可执行文件

python - 需要帮助从 pandas 数据框中过滤前 3 个计数