我发现一个转换 matrix to das pandas DataFrame 的线程。但是,我想做相反的事情 - 我有一个 pandas DataFrame,其中包含以下结构的时间序列数据:
row time stamp, batch, value
1, 1, 0.1
2, 1, 0.2
3, 1, 0.3
4, 1, 0.3
5, 2, 0.25
6, 2, 0.32
7, 2, 0.2
8, 2, 0.1
...
我想要的是一个值矩阵,其中一行属于一个批处理:
[[0.1, 0.2, 0.3, 0.3],
[0.25, 0.32, 0.2, 0.1],
...]
我想使用 matplotlib 或类似工具将其绘制为热图。
有什么建议吗?
最佳答案
您可以尝试首先按所需索引进行分组:
g = df.groupby("batch")
然后通过使用 list
构造函数聚合来将此组转换为数组。
然后可以使用 .values
属性(或 .as_matrix()
函数,但这很快就会被弃用。)将结果转换为数组。
mtr = g.aggregate(list).values
此方法的一个缺点是它会创建列表数组而不是一个漂亮的数组,即使结果会导致一个非锯齿状数组。
或者,如果您知道 batch
的每个唯一值恰好获得 4 个值,则可以直接使用矩阵。
df = df.sort_values("batch")
my_indices = [1, 2] # Or whatever indices you desire.
mtr = df.values[:, my_indices] # or df.as_matrix()
mtr = mtr.reshape(-1, 4) # Only works if you have exactly 4 values for each batch
关于python - 将 PANDAS DataFrame 中的数据转换为 Python 中的矩阵的最佳方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56904383/