嗨,我有一个从两个文件读取数据的函数。我想要发生的是,外部循环开始读取第一个文件,如果第一个文件中的 lum 大于定义值 (LC),则循环跳到下一个迭代。如果不是,代码将移至 内部循环读取 hlist 并构建 x,y,z 列表(如果 idc 和 id 相同)。如果 idc 和 id 不是相同的值,它将跳到内循环的下一次迭代。当我打印测试语句时,内部循环似乎没有迭代,我不清楚为什么。我将不胜感激任何帮助
代码
def read_file(F): #Function that reads data froma file #and extracts specific data columns
X_pos = []
Y_pos = [] # Creats Data Lists
Z_pos = []
Idh = []
Id = []
LC = float(sys.argv[1])
N = 11#912639 # number of lines to be read
Nl = 11#896030
fl = open(Fl) #opens catalog file
fl.readline()
nlines_catalog = islice(fl, Nl)
f = open(F) #Opens hlist file
f.readline() # Strips Header
nlines_hlist = islice(f, N) #slices file to only read N lines
for linel in nlines_catalog:
if linel != '':
linel = linel.strip()
linel = linel.replace('\t', '')
columnsl = linel.split()
lum = float(columnsl[1])
id_catalog = int(columnsl[0])
if lum >= LC:
continue
print("lum1 =", lum)
#Id.append(idc)
print("id_catalog=", id_catalog)
for line in nlines_hlist:
if line != '':
line = line.strip()
line = line.replace('\t', ' ')
columns = line.split()
id_hlist = int(columns[1])
#Idh.append(id)
if id_hlist != id_ccatalog:
continue
print('idc =', idc, 'id =', id)
x = columns[17]
y = columns[18]
z = columns[19]
X_pos.append(x)
Y_pos.append(y) #appends data in list
Z_pos.append(z)
print(X)
X = [float(p) for p in X_pos]
Y = [float(p) for p in Y_pos]
Z = [float(p) for p in Z_pos]
Xa = numpy.array(X, dtype=float)
Ya = numpy.array(Y, dtype=float)
Za = numpy.array(Z, dtype=float)
return(Xa, Ya, Za)
编辑
对内部循环进行了更改,使其能够重置并现在可以工作。
if id_catalog == id_halo:
print('id_catalog =',id_catalog,'id_halo =',id_halo)
x = columns[17] # assigns variable to columns
y = columns[18]
z = columns[19]
#vx = columns[]
#vy = columns[]
#vz = columns[]
X_pos.append(x)
Y_pos.append(y) #appends data in list
Z_pos.append(z)
break
编辑 我无法从打印语句中重现我的原始输出,并进行了编辑以反射(reflect)这一事实
VirtualBox:~$ python /home/Astrophysics/Count_FixedLoop.py -21.5 125
('lum1 =', -21.78545)
('idc=', 2701276876L)
('idc =', 2701276876L, 'id =', 2701276876L)
('lum1 =', -21.69835)
('idc=', 2699751347L)
('lum1 =', -21.69942)
('idc=', 2699724518L)
('lum1 =', -21.74543)
('idc=', 2699724331L)
('lum1 =', -21.60912)
('idc=', 2699724726L)
('lum1 =', -21.53862)
('idc=', 2699725014L)
('lum1 =', -21.53155)
('idc=', 2701277269L)
['34.57223']
这就是我期望的输出
('lum1 =', -21.78545)
('idc=', 2701276876L)
('idc =', 2701276876L, 'id =', 2701276876L)
('lum1 =', -21.69835)
('idc=', 2699751347L)
('idc =', 2699751347L, 'id =', 2699751347L)
('lum1 =', -21.69942)
('idc=', 2699724518L)
('idc =', 2699724518L, 'id =', 2699724518L)
('lum1 =', -21.74543)
('idc=', 2699724331L)
('idc =', 2699724331L, 'id =', 2699724331L)
('lum1 =', -21.60912)
('idc=', 2699724726L)
('idc =', 2699724726L, 'id =', 2699724726L)
('lum1 =', -21.53862)
('idc=', 2699725014L)
('idc =', 2699725014L, 'id =', 2699725014L)
('lum1 =', -21.53155)
('idc=', 2701277269L)
编辑
Fl 文件的几行示例,其中 idc 编号为列 [0],lum 值为列 [1]。我在第一个循环中用粗体打印了满足条件的 idc 值。
Format: ID, scatter = 0 0.05 0.1 0.13 0.15 0.16 0.18 0.2 0.25 0.3
**2701276876 -21.78545** -21.73791 -21.68872 -21.11125 -20.88102 -22.04709 -21.41715 -20.56944 -20.36757 -19.69895
**2699751347 -21.69835** -21.67935 -21.92425 -21.03465 -21.56561 -21.42124 -21.72893 -20.78131 -20.76342 -20.34830
**2699724518 -21.69942** -21.58352 -21.71149 -21.16240 -21.18507 -22.00277 -21.81500 -20.36141 -20.78227 -20.65697
编辑
F 文件的示例行,其中包含与第一个文件匹配的 id 和相应位置
#Scale(0) Id(1) Desc_scale(2) Descid(3) Num_prog(4) Pid(5) Upid(6) Desc_pid(7) Phantom(8) Mvir(9) Orig_Mvir(10) Rvir(11) Rs(12) Vrms(13) Mmp(14) Last_mm(15) Vmax(16) X(17) Y(18) Z(19)
0.9523 **2701276876** 0.9583 2714557311 1 -1 -1 -1 0 3.56533e+13 3.56100e+13 695.459000 80.562000 548.820000 1 0.3603 561.490000 **34.57223 140.20813 130.81985** -110.000 323.430 -123.520 3.56533e+13 3.56533e+13 561.490000 599.410000 7.539e+14 -3.799e+12 -1.992e+14 0.10259
0.9523 **2699751347** 0.9583 2713034575 4 -1 -1 -1 0 3.36604e+13 3.31300e+13 678.981000 111.199000 500.400000 1 0.8083 514.010000 **28.70439 138.70247 138.52176** -215.310 252.520 -120.970 3.36604e+13 3.36604e+13 514.010000 599.250000 5.516e+14 1.044e+14 6.133e+14 0.10973
0.9523 **2699724518** 0.9583 2713007786 1 -1 -1 -1 0 2.98000e+13 2.97500e+13 654.997000 87.324000 457.460000 1 0.4863 514.660000 **8.01627 135.31783 123.13322** -178.990 558.900 1.250 2.98000e+13 2.98000e+13 514.660000 514.660000 8.529e+14 2.711e+14 -3.624e+14 0.15137
我期望的是,当两个文件中的 id 匹配时,第二个循环将附加 X、Y 和 Z 位置列表。因此,打印本例中的列表将给出
X = [34.57223,28.70439,8.01627]
Y = [140.20813,138.70247,135.31783]
Z = [130.81985,138.52176,123.13322]
最佳答案
你似乎在期待nlines
表现得像一个列表。然而,它是 iterator ,正如 Ignacio 上面指出的,它将被消耗一次。换句话说,内部循环不会在后续外部循环执行时“重置”到第一行/索引。
考虑以下(我认为)您正在做的事情的模拟。这是两个数据文件:
数据1:
file 1: one
file 1: two
file 1: three
file 1: four
file 1: five
数据2:
file 2: one
file 2: two
file 2: three
file 2: four
file 2: five
file 2: six
运行这个:
from itertools import islice
f1 = open ("Data1")
f2 = open ("Data2")
iterator1 = islice (f1, 3)
iterator2 = islice (f2, 3)
for line1 in iterator1:
print line1
for line2 in iterator2:
print line2
结果:
file 1: one
file 2: one
file 2: two
file 2: three
file 1: two
file 1: three
而人们可能会错误地认为 data2
有 3 行内容将为 data1
的前 3 行中的每一行打印.
因此,内部循环的第一次执行完全消耗iterator2
。在您自己的代码中,当 id == idc
时没有内部循环中断- 换句话说,您消耗了 interator nlines
完全在内循环第一次执行时。
另请参阅 Python: itertools.islice not working in a loop再举一个例子。
一种解决方案可能是在 id == idc
时中断内部循环。 ,但这将假设(我认为)第二个文件中的索引顺序。您可以考虑实际使用内部循环的列表,尽管考虑到实际(非测试)数据的大小,这似乎会占用大量内存。显然,您可以重新读取第二个文件,尽管性能会受到影响。
关于python - 在Python中的嵌套for循环中使用Continue语句,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11605346/