在带有标题的 python 中读取多列 tsv 文件的最简洁方法是什么,但第一列没有标题,而是包含每行的行号?
这显然是来自 R 数据帧的文件的常见格式。
示例:
A B C
1 a1 b1 c1
2 a2 b2 c2
3 a3 b3 c3
有什么想法吗?
最佳答案
取决于您之后想要对数据执行的操作(以及文件是否确实是带有\t 分隔符的 tsv)。如果您只想将其放在一组列表中,您可以使用 csv
模块,如下所示:
import csv
with open("tsv.tsv") as tsvfile:
tsvreader = csv.reader(tsvfile, delimiter="\t")
for line in tsvreader:
print line[1:]
但是,我还推荐使用 pandas
中的 DataFrame
模块来处理简单 Python 操作之外的任何操作。它可以这样使用:
from pandas import DataFrame
df = DataFrame.read_csv("tsv.tsv", sep="\t")
DataFrame 允许对数据集进行高级操作,例如添加列、查找平均值等。
关于python读取带有行号的多列tsv文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25747985/