python - 当有可变空间分隔列时在 python (numpy) 中加载数据集

标签 python numpy dataset whitespace delimiter

我有一个包含数字数据的大数据集,在它的某些行中有分隔列的可变空格,例如:

4 5 6
7  8    9
2 3 4

当我使用这条线时:

dataset=numpy.loadtxt("dataset.txt", delimiter=" ")

我收到这个错误:

ValueError: Wrong number of columns at line 2

如何更改代码以同时忽略多个空格?

最佳答案

delimiter 的默认值是“任何空格”。如果您将 loadtxt 排除在外,它会处理多个空格。

>>> from io import StringIO
>>> dataset = StringIO('''\
... 4 5 6
... 7 8     9
... 2 3 4''')
>>> import numpy
>>> dataset_as_numpy = numpy.loadtxt(dataset)
>>> dataset_as_numpy
array([[ 4.,  5.,  6.],
       [ 7.,  8.,  9.],
       [ 2.,  3.,  4.]])

关于python - 当有可变空间分隔列时在 python (numpy) 中加载数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44765565/

相关文章:

matrix - 如何从里程计/tf 数据中获取投影矩阵?

写入 STDOUT 时,python 子进程模块因 Spark-submit 命令而挂起

python - 无法在Python中使用OpenCV检测面部和眼睛

python - 规范化 Numpy 范围

python - 对于小型数组,比 scipy.ndimage.filters.laplace 更快的离散拉普拉斯算子

python - 数据集中的 load_dataset ('multi_nli' )无法正常工作,出现导入错误

python - 如何检查一个字符串是否以另一个字符串结尾,或者相反?

python - 如何定义基本的 Python 结构?

python - Python 中具有 nan 值的数组之间的平均值

python - 随机选择子目录中的 x 个文件