Python 中是否有符合这些条件的数据类或类型?
我正在尝试构建一个看起来像这样的对象:
实验数据
ID 1
- sample_info_1:
字符串
- sample_info_2:
字符串
- Dataframe_1:
pandas 数据框
- Dataframe_2:
pandas 数据框
- sample_info_1:
ID 2
- (等)
现在,我使用 dict
来保存对象('ExperimentData'),其中包含每个 ID 的namedtuple
。每个namedtuple
都有一个命名字段,用于附加到样本的相应数据。这使我能够保留所有 ID 的索引,并为每个 ID 下的所有字段建立索引。
但是,我需要在下游分析期间更新和/或替换每个 ID 下的条目。由于元组是不可变的,这似乎不可能。
有更好的实现吗?
最佳答案
您可以使用字典的字典而不是命名元组的字典。字典是可变的,因此您将能够修改内部字典。
鉴于您在评论中所说的每个 DataFrame-1 和 -2 的结构具有可比性,您还可以通过向每个包含 值的 DataFrame 添加一列将所有数据分组为一个大 DataFrame Sample_info_1
在所有行中重复,对于 sample_info_2
也是如此。然后,您可以将所有 DataFrame-1 连接成一个大的 DataFrame,同样对于 DataFrame-2,将所有数据放入两个 DataFrame。 (根据这些 DataFrame 的结构,您甚至可以将它们合并为一个。)
关于python - 可变索引异构数据结构?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38960221/