arrays - 您可以将 Matlab 数组和结构的复合数据存储和查询到数据库中吗?

标签 arrays database matlab hdf

如何将位于“struct within struct within struct”中的 Matlab 数组存储到数据库中,以便我随后可以检索字段和数组?

下面详细说明了我为什么需要这个:

我有大量数据保存为 .mat 文件....麻烦的是我需要加载一个完整的 .mat 文件才能开始在那里处理和绘制数据。如果该文件很大,将它加载到内存中就成了一项相当大的任务。

这些 .mat 文件是分析晶体管原始电气测量数据的结果。所有 .mat 文件都具有相同的结构,但每个文件对应一个不同且唯一的晶体管。

现在假设我想比较 A 和 B 中共有的所有晶体管中的某个参数,我必须手动搜索并加载我需要的所有 .mat 文件,然后尝试进行比较。没有简单的方法可以将所有这些 .mat 文件合并到一个 .mat 文件中(因为它们都具有相同的变量名称但具有不同的数据)。即使这是可能的,我也不知道如何从 .mat 文件中查询特定条目。

如果没有可以从中查询特定条目的结构化数据库,我看不出有什么方法可以轻松地做到这一点。然后我可以使用任何编程语言(继续使用 Matlab 或切换到 python)来方便地进行比较和绘图等。没有分散的 .mat 文件的麻烦。

问题在于 .mat 文件中的数据以结构和大型数组的形式构建。据我所知,将其存储在一个简单的 SQL 数据库中并不是一项简单的任务。我使用 HDF5 进行了查找,但来自 examples我看到,我必须执行很多低级命令才能将这些结构存储在 HDF 文件中,我不确定我是否可以将 HDF 文件的一部分加载到 Matlab/python 中,或者我是否还必须加载整个文件首先在内存中。

这里的目标是将所有现有的(和将要创建的).mat 文件(及其结构和数组的复合数据结构)合并到一个数据库文件中,我可以从中查询特定条目。是否有数据库解决方案可以保留我的复杂数据的结构? HDF 是正确的选择吗?还是我缺少一个简单的解决方案?

编辑:

我需要保存和检索的数据示例:

All(16).rf.SS(3,2).data

其中 All 是一个包含 7 个字段的结构数组。 rf 字段中的每个结构都是一个包含数组、整数、字符串和结构的结构。其中一个结构名为 SS,它又是一个结构数组,每个结构包含一个名为 data 的 2x2 数组。

最佳答案

将 .mat 文件合并为一个数据结构

一般来说,没有简单的方法可以将....mat 文件合并到单个 .mat 文件中(因为它们都具有相同的变量名称但具有不同的数据),这是不正确的

假设您有两个文件,data1.matdata2.mat,每个文件包含两个变量,a b。你可以这样做:

>> s = load('data1')
s = 
  struct with fields:

    a: 'foo'
    b: 3

>> s(2) = load('data2')
s = 
  1×2 struct array with fields:
    a
    b

现在你有一个 struct array (见下面的注释)。您可以像这样访问其中的数据:

>> s(1).a
ans =
    'foo'

>> s(2).a
ans =
    'bar'

但您也可以一次获取每个字段的所有值,如 comma-separated list ,您可以将其分配给元胞数组或矩阵:

>> s.a
ans =
    'foo'
ans =
    'bar'

>> allAs = {s.a}
allAs =
  1×2 cell array
    {'foo'}    {'bar'}

>> allBs = [s.b]
allBs =
     3     4

注意: 烦人的是,您似乎必须先创建具有正确字段的结构,然后才能使用索引对其进行分配。也就是说

s = struct;
s(1) = load('data1')

不会工作,但是

s = struct('a', [], 'b', [])
s(1) = load('data1')

没问题。

为 .mat 文件建立索引

如果您不需要能够搜索每个 .mat 文件中的所有数据,只需搜索某些字段,您可以在 MATLAB 中构建一个索引,其中仅包含每个 .mat 文件中的相关元数据以及一个引用 (例如文件名)到文件本身。作为长期解决方案,这不太可靠,因为您必须确保索引与文件保持同步,但设置工作量应该较少。

将数据结构扁平化为与数据库兼容的表

如果您真的想将所有内容都保存在数据库中,那么您可以将您的数据结构转换为表格形式,其中任何多维元素(例如结构或数组)都被“展平”到一个表行中,每个标量值(适当命名的)表变量。

例如,如果您有一个结构 s,其中包含字段 s.as.b,并且 s.b 是一个 2 x 2 矩阵,您可以调用变量 s_as_b_1_1s_b_1_2s_b_2_1s_b_2_2 - 可能不是理想的数据库设计,但你明白了。

您应该能够修改 this answer 中的代码和/或 MATLAB 文件交换提交 flattenstruct2cellflatten-nested-cell-arrays以满足您的需求。

关于arrays - 您可以将 Matlab 数组和结构的复合数据存储和查询到数据库中吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55901538/

相关文章:

arrays - Swift 如何按键值对数组字典进行排序

java - 创建一个出现在两个给定数组java中的值数组

django - pg_restore 不恢复某个表?

java - 如何从 Parse.com 数据库中检索对象并将其显示在 Android TextView 中?

matlab - 如何在matlab中显示小波变换函数dwt2的结果

arrays - 时间与风速的误差散点图(数据来自表格)MATLAB

php - @_ -1 在 Perl 中是什么意思?

java - 我该如何修复此错误 java.util.ConcurrentModificationException

java - SparseMultigraph<V, E> 和 SparseGraph<V, E> 有什么区别?

matlab - 将神经网络应用于可变长度语音片段的 MFCC