python读取带有行号的多列tsv文件

标签 python dataframe csv

在带有标题的 python 中读取多列 tsv 文件的最简洁方法是什么,但第一列没有标题,而是包含每行的行号?

这显然是来自 R 数据帧的文件的常见格式。

示例:

    A      B  C
1   a1     b1 c1
2   a2     b2 c2
3   a3     b3 c3

有什么想法吗?

最佳答案

取决于您之后想要对数据执行的操作(以及文件是否确实是带有\t 分隔符的 tsv)。如果您只想将其放在一组列表中,您可以使用 csv 模块,如下所示:

import csv
with open("tsv.tsv") as tsvfile:
    tsvreader = csv.reader(tsvfile, delimiter="\t")
    for line in tsvreader:
        print line[1:]

但是,我还推荐使用 pandas 中的 DataFrame 模块来处理简单 Python 操作之外的任何操作。它可以这样使用:

from pandas import DataFrame
df = DataFrame.read_csv("tsv.tsv", sep="\t")

DataFrame 允许对数据集进行高级操作,例如添加列、查找平均值等。

关于python读取带有行号的多列tsv文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25747985/

相关文章:

python - 在 Django DRF 中,我总是在序列化器的更新方法中收到 ValueError

Python - 只能连接列表而不是 float 列表

python - Django:更新或更改以前保存的模型数据

Pandas 数据框插入缺失的日子

java - 使用univocity解析两个不同的csv文件并写入新的csv文件

Python CGI 内部错误 login.html login.cgi

python - 为 Pandas Dataframe 中的重复集创建规则

r - 如何将多列转换为观察值

javascript - 从 Meteor.js 集合创建 CSV 文件

rest - FOSRestBundle 自定义 View 处理程序未注册