python - 我正在尝试找到一种将 numpy 数组转换为 hdf5 格式的方法

标签 python pytorch recurrent-neural-network hdf5 hdf

我正在尝试将 Numpy 数组转换为 HDF5 格式,在多种情况下随时间变化,例如 Numpy 数组具有以下方面:案例编号(0-100)、时间(0-200 年)、 X 网格点位置 (0-100m)、y 网格点位置 (0-20m) 加上该位置的实际数据点(例如饱和度范围为 0-100%)。我发现以 HDF5 格式有效存储有点困难。稍后应该用它来训练 RNN 模型。 我尝试将 Numpy 分配给 HDF5 格式(不知道它是否有效,因为我没有检索它)。我还对这种情况的不同类型的存储选项以及存储它的最佳方式感到困惑,以便可以轻松检索它来训练神经网络。我需要使用 HDF5 格式,因为它似乎可以优化当前情况下大数据的使用/检索。我也在尝试找到学习 HDF5 格式的最佳方法。谢谢!

最佳答案

import h5py
import numpy as np

# Create a numpy array
arr = np.random.rand(3,3)

# Create a HDF5 file
with h5py.File('mydata.h5', 'w') as f:
    # Write the numpy array to the HDF5 file
    f.create_dataset('mydata', data=arr)

您还可以使用 h5py 库将数据附加到现有 hdf5 文件,而不是创建新文件。

关于python - 我正在尝试找到一种将 numpy 数组转换为 hdf5 格式的方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/75205055/

相关文章:

python - 在Python中,应该如何测试环境变量中指定的路径中是否存在文件?

pycharm - PyCharm 中的 PyTorch 特定检查问题

Keras功能API : Combine CNN model with a RNN to to look at sequences of images

python - 在python中,如何按元素的频率对列表进行排序

python 2.7 - 如何调用父类构造函数

python - Django Restful框架身份验证HTTP Post错误

python - 我什么时候应该在 LSTM 代码中初始化状态?

python - Pytorch DataLoader内存未释放

python - 如何在for循环中索​​引张量?

tensorflow - 在 TensorFlowdynamic_rnn 中使用sequence_length参数时如何处理填充