<分区>
我是 Python 新手。我有 10 个格式如下所示的输入文件。每个文件都包含一个接收器(接收器 1-10)的测量数据。每个接收器都有来自 10 个发射器(发射器 1-10)的测量值。这些文件按时间顺序排列,以秒为单位。
我想逐行同时读取 10 个文件。在读取文件时,我想从每个文件中为每个发射器收集 4 个测量值,并对这些值进行平均,以获得每个接收器-发射器对的 4 秒平均值。我想跟踪每个接收器-发射器对的每个平均值。一旦我收集了特定接收器的所有发射器的 4 秒平均值,我想对这些值进行平均以获得该接收器的平均值。我还想跟踪这些平均值(时间平均值和测量平均值)以及它们属于哪个接收器。
我无法将这些文件加载到内存中,因为这些文件很大(以千兆字节为单位)。由于文件的大小,将所有平均值保存在内存中也是一个问题。我只想为每个接收器-发送器对保留一个小时的数据,以获取内存中的平均值。一旦我有了一个小时的平均值,当计算出一个新的平均值时,我想丢弃最旧的平均值。
我当时认为字典可能是跟踪数据的最佳方式。
我怎样才能完成上面的任务?
输入文件:
列格式:时间(秒)Transmitter# Measurement
0.0 1 2.4779E+02
0.0 2 2.8147E+02
0.0 3 2.7437E+02
0.0 4 2.6661E+02
0.0 5 2.2637E+02
0.0 6 2.1457E+02
0.0 7 2.3750E+02
0.0 8 2.9573E+02
0.0 9 2.7339E+02
0.0 10 2.4982E+02
1.0 1 2.1086E+02
1.0 2 2.7459E+02
1.0 3 2.1569E+02
1.0 4 2.0018E+02
1.0 5 2.8732E+02
1.0 6 2.2633E+02
1.0 7 2.2900E+02
1.0 8 2.6883E+02
1.0 9 2.4482E+02
1.0 10 2.8314E+02
2.0 1 2.6987E+02
2.0 2 2.5946E+02
2.0 3 2.8195E+02
2.0 4 2.3097E+02
2.0 5 2.2592E+02
2.0 6 2.5316E+02
2.0 7 2.5562E+02
2.0 8 2.5892E+02
2.0 9 2.1258E+02
2.0 10 2.5791E+02