python - Pandas 按行读取数据

通常，数据以作为变量的列显示，但例如，如果我在 .txt 文件中有类似的内容

Data1,1,2,3,4,5
Data2,3,1,4

我能否以构建数据框的方式使用 pandas，就像我从中获得的那样

d = {"Data1":[1,2,3,4,5], "Data2": [3,1,4,1,2]}
df = pd.DataFrame(data=d)

编辑: 最初我希望数据集的大小不同，但 pandas 不允许它抛出 ValueError

最佳答案

读入文件，转置数据框，稍微修改一下……等等。

伪造文件的设置:

>>> from io import StringIO
>>> file = StringIO('''Data1,1,2,3,4,5
...:Data2,3,1,4''')

创建数据框:

>>> df = pd.read_csv(file, header=None).T
>>> df = df.rename(columns=df.loc[0]).drop(0, axis=0)
>>> 
>>> df
>>> 
  Data1 Data2
1     1     3
2     2     1
3     3     4
4     4   NaN
5     5   NaN

然而，这在 this 中做得更优雅一些。 Peter Leimbigler 的回答!

正如 ALollz 所指出的，这些解决方案仅在文件中没有任何行的字段多于第一行时才有效。

这是我对更普遍适用的解决方案的尝试:

>>> file = StringIO('''Data1,3,1,4
...:Data2,1,2,3,4,5
...:Data3,7,8''')
>>> df = pd.concat([pd.Series(line.split(',')) for line in file], axis=1)
>>> df.rename(columns=df.loc[0]).drop(0, axis=0).astype(float)
>>> 
   Data1  Data2  Data3
1    3.0    1.0    7.0
2    1.0    2.0    8.0
3    4.0    3.0    NaN
4    NaN    4.0    NaN
5    NaN    5.0    NaN

关于python - Pandas 按行读取数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53341774/

上一篇：python - 为什么我们在 python 的 for 循环中使用 range(len)？

下一篇：python - Pandas :枚举索引中的重复项

python - 应用 TensorFlow Transform 来转换/缩放生产中的特征

python - 如何在django html模板中调用函数

python - 如何迭代单个或多个项目？

python - Pandas 按值过滤数据透视表

Python - Pandas 转置游戏日志数据

python - 如何处理 Pandas 中的SettingWithCopyWarning

python - 如何迭代数据框

python - 如何基于公共(public)列将一个数据帧的列值替换为另一个数据帧的值？

python - pandas df 中两列之间的累积计数