python - 从单个文件读取并写入 2 个单独的文件会产生意想不到的结果

标签 python

我正在尝试使用 Python 从 Slurm 输出文件中提取一些值,但是 write() 方法似乎没有按预期工作(或者我不理解它的用法那好)。

Link 下载输出文件slurm-5089.out:

仅提取值并将它们放入两个单独的文件中是成功的:

for line in f:
    if line[:2] == "nu":
        nuof.write(line[5:])
    if line[:2] == "C ":
        Cof.write(line[4:])

但是当我尝试将值(每个类别/文件 150 个)划分为子类别(nu-SVC 或 C-SVC,每个 30 个值)时,在属于特定的每组值之前提及子类别它没有给出预期的结果,这是我用来这样做的最后一段代码:

for line in f:
    if line[:4] == "**Tr":
        if i in nu:
            print(i)
            print(type[i])
            nuof.write(type[i]+'\n')
            print(line)
            i += 1
        if  i in C:
            print(i)
            print(type[i])
            Cof.write(type[i]+'\n')
            print(line)
            i += 1

对于我打开的文件,列表 nuCtype 和我打开的计数器 i使用,这是他们的初始化:

from __future__ import print_function

i = 0

nu = [0,1,2,3,4]
C = [5,6,7,8]

type = ['-----nu-SVC-----', '-----nu-SVC-----', '-----nu-SVC-----', '-----nu-SVC-----', '-----nu-SVC-----', '-----C-SVC-----', '-----C-SVC-----', '-----C-SVC-----', '-----C-SVC-----']

Cof = open('C_values', 'w')
nuof = open('nu_values', 'w')
f = open('slurm-5089.out', 'r')

这就是我在我的 C_values 文件中添加第一个 -----def----- 的方式:

Cof.write('-----def-----\n')

Link 下载我在 C_values 文件中得到的输出。

Link 下载我在 nu_values 文件中得到的输出。

这是我打算获得的:

-----def-----
1.067648
1.699384
1.137877
2.148189
327.390817
2.668285
1.015005
1.834085
1.085050
2.512783
330.863862
2.492146
1.016106
1.741183
0.905885
2.451512
477.157341
2.679206
1.118905
1.952953
1.071948
2.459619
400.765942
2.798353
0.783165
1.990212
0.877010
2.093311
331.349704
2.671817
-----C-SVC-----
0.121222
0.196481
0.126245
0.350959
9036.687632
0.459966
0.111442
0.213469
0.128784
0.430376
8188.026398
0.436184
0.118351
0.201235
0.108417
0.400938
10286.065268
0.433921
0.129255
0.226374
0.126481
0.482451
13273.184496
0.525713
0.097013
0.236698
0.105254
0.344640
6230.513754
0.458801
-----C-SVC-----
16.107007
21.039873
16.553491
30.173238
1674.267295
35.782899
15.238036
20.423749
16.830935
31.339246
1698.550375
31.147013
16.274621
20.223880
16.434865
31.521544
2353.794493
36.805332
16.764180
23.052520
17.781023
31.867347
2182.786987
32.875505
13.401091
23.094557
14.890684
25.336002
1653.916156
34.239836
-----C-SVC-----
1.067648
1.699384
1.137877
2.148189
327.390817
2.668285
1.015005
1.834085
1.085050
2.512783
330.863862
2.492146
1.016106
1.741183
0.905885
2.451512
477.157341
2.679206
1.118905
1.952953
1.071948
2.459619
400.765942
2.798353
0.783165
1.990212
0.877010
2.093311
331.349704
2.671817
-----C-SVC-----
2.319126
3.974477
2.463397
7.358145
130.813731
9.923179
2.175899
4.486890
2.503507
9.056446
129.852183
9.817307
2.256106
4.008876
2.078878
8.397495
113.754769
9.262230
2.685915
4.782272
2.459403
11.044663
120.761463
10.852858
1.885747
4.804282
1.992187
8.006820
118.607456
10.239223

C_values 文件中的某些部分实际上组织得很好,值被拆分为准确的预期数量(每个子类别 30 个值),即最后 2 组值,并且来自-----def----- 直到第一个 -----C-SVC----- 正好有 90 个值代表 3 个子-类别;在此示例中(仅适用于 C_values)值应分为 5 个部分,即文件中有多少个分隔符 [标题],这证明计数实际上执行良好,但我不不太了解循环如何与输出文件中的最后两个 -----C-SVC----- 以及 90 个值组一起工作,我尝试编写不同的部分的代码,但它们都没有工作,并且提供的代码给出了接近我想要的结果,它是我内置的 write() 方法的东西还是我遗漏了什么在这里?

最佳答案

我走了另一条路,它给了我想要的结果,我试着写 nu 值和 C 值到 nu_valuesC_values 文件,同时当计数器(变量 i )达到一定数量(变量 count ,在这种情况下,它是 30 从 14 列表中选择消息 5x605 (在我最后的代码中,我将其更改为 type[],因为 tp[] 编辑器将其突出显示为 python 关键字),然后它将 vim 分配给 0 以便重新开始,这个问题即使它给出了非凡的性能(将近 4 分钟)对于大小为 245 MB 的文件),是它在函数内部调用函数并读取输入文件( i )以首先计算以 sys.argv[1]nu 开头的行,然后开始写入过程(因此它有点重复相同的过程),但无论如何这是我的解决方案:

tp = ['---C1----\n', '----C2----\n', '-----C3-----\n', '-----C4-----\n', '-----N1-----\n', '-----N2-----\n', '-----N3-----\n', '-----N4-----\n']


def line_counter():
    count = 0
    f = open(sys.argv[1], 'r')
    for line in f.xreadlines():
        if line[:2] == "nu":
            count += 1
        if line[:2] == "C ":
            count += 1
    f.close()
    return count


def to_file():
    Cof = open('C_values_'+sys.argv[1], 'w')
    nuof = open('nu_values_'+sys.argv[1], 'w')
    f = open(sys.argv[1], 'r')
    Cof.write("-----Cdef-----\n")
    nuof.write("-----Ndef-----\n")
    count = (line_counter()/10)
    i = 0
    j = 0
    k = 4
    for line in f:
        if line[:2] == "C ":
            i += 1
            Cof.write(line[4:])
            if i == count:
                if j in (0,1,2,3):
                    Cof.write(tp[j])
                i = 0
                j += 1
        if line[:2] == "nu":
            i += 1
            nuof.write(line[5:])
            if i == count:
                if k in (4,5,6,7):
                    nuof.write(tp[k])
                i = 0
                k += 1
    f.close()
    nuof.close()
    Cof.close()
    print("Finished!")

关于python - 从单个文件读取并写入 2 个单独的文件会产生意想不到的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55601242/

相关文章:

Python Ctypes - 加载 dll 抛出 OSError : [WinError 193] %1 is not a valid Win32 application

Python 2.6 : proper usage of unittest. 测试套件

python - 安装 virtualenv 后,我不能再运行 ipython/jupyter

python - 搜索多维数组

用于多图像 TIFF 的 Python PIL For Loop

python - 如何在 MS Word 中使用 win32com.client.constants?

python - 如何将颠倒的元音大写?

python - 如何将字符串 '1.000,0.001' 转换为复数 (1+0.001j)?

python - 如何使用 suds 连接到网络服务?

python - 根据模式分句