python - 如何在 Python 中使用 xarray 连接来自多个 netCDF 文件的数据？

标签 python concatenation netcdf python-xarray

我正在尝试在 Python 中使用 xarray 打开多个 netCDF 文件。这些文件具有相同形状的数据，我想加入它们，创建一个新的维度。

我尝试对 xarray.open_mfdataset() 使用 concat_dim 参数，但它没有按预期工作。下面给出一个例子，打开两个温度数据文件124次，241个纬度和480个经度:

DS = xr.open_mfdataset( 'eraINTERIM_t2m_*.nc', concat_dim='cases' )
da_t2m = DS.t2m

print( da_t2m )

使用此代码，我希望结果数据数组的形状类似于 (cases: 2, time: 124, latitude: 241, longitude: 480)。但是，它的形状是(案例:2，时间:248，纬度:241，经度:480)。它创建了一个新维度，但也对最左边的维度求和:两个数据集的“时间”维度。我想知道这是“xarray.open_mfdateset”的错误还是预期的行为，因为两个数据集的“时间”维度都是无限的。

有没有办法直接使用 xarray 连接这些文件中的数据并获得上述预期返回？

谢谢。

马特乌斯

最佳答案

从我的评论延伸我会试试这个:

def preproc(ds):
    ds = ds.assign({'stime': (['time'], ds.time)}).drop('time').rename({'time': 'ntime'})
    # we might need to tweak this a bit further, depending on the actual data layout
    return ds

DS = xr.open_mfdataset( 'eraINTERIM_t2m_*.nc', concat_dim='cases', preprocess=preproc)

这里的好处是，在重命名原始维度 (time -> ntime) 的同时，您将原始时间坐标保留在 stime 中.

如果一切正常，您应该得到结果维度为 (cases, ntime, latitude, longitude ).

免责声明:我在带有最终连接的循环中做了类似的事情(效果很好)，但没有测试 preprocess 方法。

关于python - 如何在 Python 中使用 xarray 连接来自多个 netCDF 文件的数据？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55457872/

上一篇：python - O(n) 复杂度算法，无需 remove() 方法即可从未排序的列表中删除值的实例

下一篇：python - 在 Python 中按索引合并列表

相关文章：

r - 使用 ncdf4::ncvar_get 时如何指定维度顺序？

python - xarray计算多年netcdf的月平均值

python - 使用 netcdf 创建向量到数组中

python - 什么是 C++ 相当于 'r' 前缀在 Python 中的字符串？

python - MacOS 塞拉利昂 : modify $PATH globally

vector - 如何在一行中连接不可变向量？

c - 使用C语言在嵌入式系统中进行可靠的字符串连接

python - 如何从静态页面获取值并将其发布到模型中

python - 一个函数中的一个函数是否会比单独定义这两个函数占用更多的 RAM 内存？

javascript - 用数组连接 2 个对象并删除重复项 (js)