python - 将 PANDAS DataFrame 中的数据转换为 Python 中的矩阵的最佳方法

标签 python pandas

我发现一个转换 matrix to das pandas DataFrame 的线程。但是,我想做相反的事情 - 我有一个 pandas DataFrame,其中包含以下结构的时间序列数据:

row time stamp, batch, value
1, 1, 0.1
2, 1, 0.2
3, 1, 0.3
4, 1, 0.3
5, 2, 0.25
6, 2, 0.32
7, 2, 0.2
8, 2, 0.1
...

我想要的是一个值矩阵,其中一行属于一个批处理:

[[0.1, 0.2, 0.3, 0.3],
[0.25, 0.32, 0.2, 0.1],
...]

我想使用 matplotlib 或类似工具将其绘制为热图。

有什么建议吗?

最佳答案

您可以尝试首先按所需索引进行分组:

g = df.groupby("batch")

然后通过使用 list 构造函数聚合来将此组转换为数组。 然后可以使用 .values 属性(或 .as_matrix() 函数,但这很快就会被弃用。)将结果转换为数组。

mtr = g.aggregate(list).values

此方法的一个缺点是它会创建列表数组而不是一个漂亮的数组,即使结果会导致一个非锯齿状数组。

或者,如果您知道 batch 的每个唯一值恰好获得 4 个值,则可以直接使用矩阵。

df = df.sort_values("batch")
my_indices = [1, 2] # Or whatever indices you desire.
mtr = df.values[:, my_indices] # or df.as_matrix()
mtr = mtr.reshape(-1, 4) # Only works if you have exactly 4 values for each batch

关于python - 将 PANDAS DataFrame 中的数据转换为 Python 中的矩阵的最佳方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56904383/

相关文章:

Python Pandas 插入带有列值的新行

python - 在 post_save 上添加 M2M

python - 使用 argmax 从 Tensor 获取值

python - DataFrame 索引与日期系列

pandas - 图例在 pandas 散点图上显示类别的颜色

python - Pandas 样式的默认 float 格式

python - 使用字符串列表作为模式分割字符串

python - 内存到 DP 解决方案 - 进行更改

python - 如何捕获多线程的异常?

python - Pandas:以 'column' 标题作为行元素读取时间序列数据的 CSV