我有一个包含数字数据的大数据集,在它的某些行中有分隔列的可变空格,例如:
4 5 6
7 8 9
2 3 4
当我使用这条线时:
dataset=numpy.loadtxt("dataset.txt", delimiter=" ")
我收到这个错误:
ValueError: Wrong number of columns at line 2
如何更改代码以同时忽略多个空格?
最佳答案
delimiter
的默认值是“任何空格”。如果您将 loadtxt
排除在外,它会处理多个空格。
>>> from io import StringIO
>>> dataset = StringIO('''\
... 4 5 6
... 7 8 9
... 2 3 4''')
>>> import numpy
>>> dataset_as_numpy = numpy.loadtxt(dataset)
>>> dataset_as_numpy
array([[ 4., 5., 6.],
[ 7., 8., 9.],
[ 2., 3., 4.]])
关于python - 当有可变空间分隔列时在 python (numpy) 中加载数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44765565/