python - 当行具有多个值时比较 Python 中的两个 CSV 文件

标签 python csv dictionary compare

我有两个要比较的 CSV 文件,其中一个如下所示:

"a" 1   6   3   1   8
"b" 15  6   12  5   6
"c" 7   4   1   4   8
"d" 14  8   12  11  4
"e" 1   8   7   13  12
"f" 2   5   4   13  9
"g" 8   6   9   3   3
"h" 5   12  8   2   3
"i" 5   9   2   11  11
"j" 1   9   2   4   9

所以“a”拥有数字 1、6、3、1、8 等。实际的 CSV 文件有 1,000 行长,因此您在编写代码时为了效率而知道。

第二个 CSV 文件如下所示:

4

15

7

9

2

我已经编写了一些代码来将这些 CSV 文件导入到 python 列表中。

with open('winningnumbers.csv', 'rb') as wn:
    reader = csv.reader(wn)
    winningnumbers = list(reader)

wn1 = winningnumbers[0]
wn2 = winningnumbers[1]
wn3 = winningnumbers[2]
wn4 = winningnumbers[3]
wn5 = winningnumbers[4]

print(winningnumbers)

with open('Entries#x.csv', 'rb') as en:
    readere = csv.reader(en)
    enl = list(readere)

我现在如何使用第一个 csv 文件搜索 CSV 文件 2 的交叉引用编号 4 so wn1。这样它就返回“b”中有 wn1。我将它们作为列表导入,看看我是否能弄清楚如何去做,但最终却陷入了困境。我也尝试过使用 dict() 但没有成功。

最佳答案

如果我没理解错的话,您想要找到获胜条目中数字的第一个索引(或所有索引)。如果需要,您可以这样做:

with open('winningnumbers.csv', 'rb') as wn:
    reader = csv.reader(wn)
    winningnumbers = list(reader)

with open('Entries#x.csv', 'rb') as en:
    readere = csv.reader(en)
    winning_number_index = -1 # Default value which we will print if nothing is found
    current_index = 0 # Initial index
    for line in readere: # Iterate over entries file
        all_numbers_match = True # Default value that will be set to False if any of the elements doesn't match with winningnumbers
        for i in range(len(line)):
            if line[i] != winningnumbers[i]: # If values of current line and winningnumbers with matching indexes are not equal
                all_numbers_match = False # Our default value is set to False
                break # Exit "for" without finishing

        if all_numbers_match == True: # If our default value is still True (which indicates that all numbers match)
            winning_number_index = current_index # Current index is written to winning_number_index
            break # Exit "for" without finishing
        else: # Not all numbers match
            current_index += 1 

print(winning_number_index)

这将打印条目中第一个中奖号码的索引(如果您想要所有索引,请在评论中写下)。

注意:这不是解决您问题的最佳代码。如果您不熟悉 Python 的更高级功能,理解和调试会更容易。


您可能应该考虑不要缩写您的变量。 entries_readerreadere 多花一秒钟的时间来编写,少 5 秒钟来理解。


这是更快、更短、内存效率更高的变体,但可能更难理解:

with open('winningnumbers.csv', 'rb') as wn:
    reader = csv.reader(wn)
    winningnumbers = list(reader)

with open('Entries#x.csv', 'rb') as en:
    readere = csv.reader(en)
    for line_index, line in enumerate(readere):            
        if all((line[i] == winningnumbers[i] for i in xrange(len(line)))):
            winning_number_index = line_index
            break
    else:
        winning_number_index = -1

print(winning_number_index)

我可能不清楚的功能可能是 enumerate()any() 和在 for 中使用 else > 而不是在 if 中。让我们一一过一遍。


要了解枚举的这种用法,您需要了解该语法:

a, b = [1, 2]

变量 ab 将根据列表中的值分配。在这种情况下,a 将为 1,b 将为 2。使用此语法,我们可以做到这一点:

for a, b in [[1, 2], [2, 3], ['spam', 'eggs']]:
    # do something with a and b

在每次迭代中,a 和 b 将分别为 1 和 2、2 和 3,相应地为“垃圾邮件”和“鸡蛋”。

假设我们有一个列表a = ['spam', 'eggs', 'potatoes']enumerate() 只返回一个像这样的“列表”:[(1, 'spam'), (2, 'eggs'), (3, 'potatoes')]。所以,当我们这样使用它时,

for line_index, line in enumerate(readere):
    # Do something with line_index and line

line_index 将为 1、2、3 等


any() 函数接受一个序列(列表、元组等)并返回 True 如果其中的所有元素都等于 True.

生成器表达式 mylist = [line[i] == winningnumbers[i] for i in range(len(line))] 返回一个列表,类似于以下内容:

mylist = []
for i in range(len(line)):
    mylist.append(line[i] == winningnumbers[i]) # a == b will return True if a is equal to b

因此,any 只有在输入的所有号码都与中奖号码匹配的情况下才会返回 True。


forelse 部分中的代码仅在for 未被break 中断时被调用,因此在我们的情况是设置默认索引返回。

关于python - 当行具有多个值时比较 Python 中的两个 CSV 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32811877/

相关文章:

python - python 中无聊的阶乘

python - 如果某些列匹配且某些列不同,如何连接行

javascript - 具有多个动态选择框angularjs

vba - 有没有一种方法可以使用与 VBA 的默认分隔符 (vbCr/vbCrLf) 不同的分隔符一次一行地读取文件?

c++ - 在 C++ 中,如何以与从映射中检索值相同的顺序从 vector 中检索值?

dictionary - 如何让 SwiftUI 检测对字典的更改?

python - sagemath 中符号向量之间的相等性

python - 如何用递增的数字填充二维数组?

android - 将字符串值从自定义对话框传递到另一个 Activity

c# - 如何访问词典项目?