我有一个包含两个数据集的文件,我想将其作为两列读入 Python。
数据的形式是:
xxx yyy xxx yyy xxx yyy
等等,所以我知道我需要以某种方式将其拆分。我是 Python 的新手(并且对编程相对较新),所以到目前为止我一直在努力。目前我尝试使用:
def read(file):
column1=[]
column2=[]
readfile = open(file, 'r')
a = (readfile.read())
readfile.close()
我如何将读入文件拆分为 column1 和 column2?
最佳答案
这对于 Python 模块 Pandas 来说非常简单。 假设你有这样一个数据文件:
>cat data.txt
xxx yyy xxx yyy xxx yyy
xxx yyy xxx yyy xxx yyy
xxx yyy xxx yyy xxx yyy
xxx yyy xxx yyy xxx yyy
xxx yyy xxx yyy xxx yyy
>from pandas import DataFrame
>from pandas import read_csv
>from pandas import concat
>dfin = read_csv("data.txt", header=None, prefix='X', delimiter=r"\s+")
> dfin
X0 X1 X2 X3 X4 X5
0 xxx yyy xxx yyy xxx yyy
1 xxx yyy xxx yyy xxx yyy
2 xxx yyy xxx yyy xxx yyy
3 xxx yyy xxx yyy xxx yyy
4 xxx yyy xxx yyy xxx yyy
>dfout = DataFrame()
>dfout['X0'] = concat([dfin['X0'], dfin['X2'], dfin['X4']], axis=0, ignore_index=True)
>dfout['X1'] = concat([dfin['X1'], dfin['X3'], dfin['X5']], axis=0, ignore_index=True)
> dfout
X0 X1
0 xxx yyy
1 xxx yyy
2 xxx yyy
3 xxx yyy
4 xxx yyy
5 xxx yyy
6 xxx yyy
7 xxx yyy
8 xxx yyy
9 xxx yyy
10 xxx yyy
11 xxx yyy
12 xxx yyy
13 xxx yyy
14 xxx yyy
希望对您有所帮助。 最好的。
关于python - 如何拆分成列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26483287/