Python - 两个字符串之间的区别

标签 python string python-3.x diff

我想在一个列表中存储很多单词。其中许多词非常相似。例如,我有单词 afrykanerskojęzyczny 和许多单词,例如 afrykanerskojęzycznymafrykanerskojęzyczninieafrykanerskojęzyczni。找到两个字符串之间的差异并从第一个字符串和 diff 恢复第二个字符串的有效(快速且差异大小)解决方案是什么?

最佳答案

您可以使用 ndiff在 difflib 模块中执行此操作。它具有将一个字符串转换为另一个字符串所需的所有信息。

一个简单的例子:

import difflib

cases=[('afrykanerskojęzyczny', 'afrykanerskojęzycznym'),
       ('afrykanerskojęzyczni', 'nieafrykanerskojęzyczni'),
       ('afrykanerskojęzycznym', 'afrykanerskojęzyczny'),
       ('nieafrykanerskojęzyczni', 'afrykanerskojęzyczni'),
       ('nieafrynerskojęzyczni', 'afrykanerskojzyczni'),
       ('abcdefg','xac')] 

for a,b in cases:     
    print('{} => {}'.format(a,b))  
    for i,s in enumerate(difflib.ndiff(a, b)):
        if s[0]==' ': continue
        elif s[0]=='-':
            print(u'Delete "{}" from position {}'.format(s[-1],i))
        elif s[0]=='+':
            print(u'Add "{}" to position {}'.format(s[-1],i))    
    print()      

打印:

afrykanerskojęzyczny => afrykanerskojęzycznym
Add "m" to position 20

afrykanerskojęzyczni => nieafrykanerskojęzyczni
Add "n" to position 0
Add "i" to position 1
Add "e" to position 2

afrykanerskojęzycznym => afrykanerskojęzyczny
Delete "m" from position 20

nieafrykanerskojęzyczni => afrykanerskojęzyczni
Delete "n" from position 0
Delete "i" from position 1
Delete "e" from position 2

nieafrynerskojęzyczni => afrykanerskojzyczni
Delete "n" from position 0
Delete "i" from position 1
Delete "e" from position 2
Add "k" to position 7
Add "a" to position 8
Delete "ę" from position 16

abcdefg => xac
Add "x" to position 0
Delete "b" from position 2
Delete "d" from position 4
Delete "e" from position 5
Delete "f" from position 6
Delete "g" from position 7

关于Python - 两个字符串之间的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17904097/

相关文章:

string - 在golang中,为什么 `a := []int32("hello")` work but not ` a := []int ("hello")`?

java - 检查给定的字符串是否可以由给定的一组字符串组成

python-3.x - 简单的python,需要解释

python - 通过比较日期替换行值

python - sklearn LinearSVC - X 每个样本有 1 个特征;期待 5

python - 在 Python 的 load_entry_point 期间找不到模块

ruby - 如何将文本拆分为键值对?

python - 如何将 UTF-8 "From:"地址添加到邮件中?

c++ - 将 C++ 缓冲区公开为 Python 3 字节

python - 新手问题 - 将函数一分为二