python - 比较两个文本列表,检查是否重复并将其标记为行尾

标签 python duplicates text-files

我正在尝试制作一个由 3 部分组成的程序。我有两个文本文件,文本文件 A 和文本文件 B

文本文件A必须将数据与文本文件B进行比较。如果有重复,则会通过电子邮件发送。 如果没有重复,则将数据写入文本文件B。

我遇到的问题是,复制总是从文本文件的开头开始。我正在尝试查找代码,从检查的最后一行开始。

这是我的重复代码。

f1 = open("/path/to/file1", "r") 
f2 = open("/path/to/file2", "r") 

txtfileA = f1.read()
txtfileB = f2.read()

txtfileA_words = txtfileA.split()
txtfileB_words = txtfileB.split()

result = set(textfileA_words).difference(set(txtfileB_words))

print result

是否有更好的代码集,我做错了什么吗?

任何建议都会很好。

最佳答案

您应该使用交集函数,而不是差异函数。另外,您的变量名称有一个拼写错误。

f1 = open("/path/to/file1", "r") 
f2 = open("/path/to/file2", "r") 

txtfileA = f1.read()
txtfileB = f2.read()

txtfileA_words = txtfileA.split()
txtfileB_words = txtfileB.split()

# remove the extra e in textfileA_words and use intersection
result = set(txtfileA_words).intersection(set(txtfileB_words))

print result

关于python - 比较两个文本列表,检查是否重复并将其标记为行尾,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24196610/

相关文章:

python - 如何让pytest重写非测试模块中的assert

mysql - 在我的特定情况下删除重复的行?

c - 将多个文本文件读入C中的数组

java - 读取巨大的文本文件Java

C# 将 DataGridView 保存到文本文件

python - 当对多列进行分组时,Pandas 将列表列与 groupby 连接起来

python - python WebSocket 客户端出现 "Connection is already closed."错误

python - 带有 lxml 子路径的 XPath 谓词?

apache-spark - 如何使结构化流中的 dropDuplicates 状态过期以避免 OOM?

MySQL 从重复条目中清理表并在依赖表中重新链接 FK