python - 如何拆分成列

标签 python split

我有一个包含两个数据集的文件,我想将其作为两列读入 Python。

数据的形式是:

xxx yyy    xxx yyy   xxx yyy

等等,所以我知道我需要以某种方式将其拆分。我是 Python 的新手(并且对编程相对较新),所以到目前为止我一直在努力。目前我尝试使用:

def read(file):

    column1=[]
    column2=[]
    readfile = open(file, 'r')
    a = (readfile.read())
    readfile.close()

我如何将读入文件拆分为 column1 和 column2?

最佳答案

这对于 Python 模块 Pandas 来说非常简单。 假设你有这样一个数据文件:

>cat data.txt
xxx  yyy  xxx  yyy  xxx yyy
xxx yyy    xxx yyy   xxx yyy
xxx yyy  xxx yyy   xxx yyy
xxx yyy    xxx yyy  xxx yyy
xxx yyy    xxx  yyy   xxx yyy

>from pandas import DataFrame
>from pandas import read_csv
>from pandas import concat
>dfin = read_csv("data.txt", header=None, prefix='X', delimiter=r"\s+")
> dfin
X0   X1   X2   X3   X4   X5
0  xxx  yyy  xxx  yyy  xxx  yyy
1  xxx  yyy  xxx  yyy  xxx  yyy
2  xxx  yyy  xxx  yyy  xxx  yyy
3  xxx  yyy  xxx  yyy  xxx  yyy
4  xxx  yyy  xxx  yyy  xxx  yyy
>dfout = DataFrame()
>dfout['X0'] = concat([dfin['X0'], dfin['X2'], dfin['X4']], axis=0, ignore_index=True)
>dfout['X1'] = concat([dfin['X1'], dfin['X3'], dfin['X5']], axis=0, ignore_index=True)
> dfout
 X0   X1
 0   xxx  yyy
 1   xxx  yyy
 2   xxx  yyy
 3   xxx  yyy
 4   xxx  yyy
 5   xxx  yyy
 6   xxx  yyy
 7   xxx  yyy
 8   xxx  yyy
 9   xxx  yyy
 10  xxx  yyy
 11  xxx  yyy
 12  xxx  yyy
 13  xxx  yyy
 14  xxx  yyy

希望对您有所帮助。 最好的。

关于python - 如何拆分成列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26483287/

相关文章:

python - 用另一列的值替换二进制列中的值

python - 为什么 ['hello' ] 是 ['hello' ] 在 Python 中返回 False?

python - 为正在运行的站点动态重新加载 URLConfs

python - 如何在Python 3.7中使用Pygame显示用Pillow加载的图像?

linux - 如何在Linux中的Thorn字符 'þ'上分割一行?

Python 原生通知

c++ - 在 C++ 中拆分点上的字符串并从中检索每个值

split - Vim/gVim中是否有命令将两个或多个选项卡组合到一个单独的分割窗口中?

javascript - 对 nextSibling 返回的节点执行拆分会返回 TypeError undefined is not a function

java - 正则表达式或拆分以在 Java 中获取数据