python - 使用 python 读取 csv 中的特定列

标签 python sql csv

我有一个如下所示的 csv 文件:

+-----+-----+-----+-----+-----+-----+-----+-----+
| AAA | bbb | ccc | DDD | eee | FFF | GGG | hhh |
+-----+-----+-----+-----+-----+-----+-----+-----+
|   1 |   2 |   3 |   4 |  50 |   3 |  20 |   4 |
|   2 |   1 |   3 |   5 |  24 |   2 |  23 |   5 |
|   4 |   1 |   3 |   6 |  34 |   1 |  22 |   5 |
|   2 |   1 |   3 |   5 |  24 |   2 |  23 |   5 |
|   2 |   1 |   3 |   5 |  24 |   2 |  23 |   5 |
+-----+-----+-----+-----+-----+-----+-----+-----+

...

如何在 python 中只读取“AAA、DDD、FFF、GGG”列并跳过标题? 我想要的输出是一个元组列表,如下所示: [(1,4,3,20),(2,5,2,23),(4,6,1,22)]。我正在考虑稍后将这些数据写入 SQL 数据库。

我引用了这篇文章:Read specific columns from a csv file with csv module? . 但我认为这对我的情况没有帮助。由于我的 .csv 文件很大,有很多列,我希望我可以告诉 python 我想要的列名,这样 python 就可以为我逐行读取特定的列。

最佳答案

我知道答案已被接受,但如果你真的想从 csv 文件中读取特定的 named 列,你应该使用 DictReader (如果你是不使用 Pandas

import csv
from StringIO import StringIO

columns = 'AAA,DDD,FFF,GGG'.split(',')


testdata ='''\
AAA,bbb,ccc,DDD,eee,FFF,GGG,hhh
1,2,3,4,50,3,20,4
2,1,3,5,24,2,23,5
4,1,3,6,34,1,22,5
2,1,3,5,24,2,23,5
2,1,3,5,24,2,23,5
'''

reader = csv.DictReader(StringIO(testdata))

desired_cols = (tuple(row[col] for col in columns) for row in reader)

输出:

>>> list(desired_cols)
[('1', '4', '3', '20'),
 ('2', '5', '2', '23'),
 ('4', '6', '1', '22'),
 ('2', '5', '2', '23'),
 ('2', '5', '2', '23')]

关于python - 使用 python 读取 csv 中的特定列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20062827/

相关文章:

mysql - 如何在触发器 INSERT AFTER mysql 中执行过程?

csv - 根据列的值删除 CSV 文件的行

mysql - mysql 中的前导零

python - Pandas 中的多索引 fillna

python - 使用 openpyxl 获取特定单元格的值

mysql - 删除重复的用户元

python - 列表分配索引超出范围?

python - 如何防止 __init__ 在目录中运行?

Python - 加入换行符

php - Mysql 两个日期的天数和分钟结果差异