我有一个文本文件,我想使用 loadtext()
将其加载到 NumPy
数组中。该文件是制表符分隔的,有时我在最后一个制表符后面有一个值而不是空:
Value1\tab\Value2\tab\value3\tab
Value4\tab\Value5\tab\value6\tab\value7
Value8\tab\Value9\tab\value10\tab
Value11\tab\Value12\tab\value13\tab
但是,NumPy
给我提供了该行的错误:
ValueError: Wrong number of columns
是否可以将这样的数据结构直接加载到 NumPy
数组中(以 None
作为值)? 或者我有要打开文件,如果没有值,请插入 None
并将操作的文本文件加载到 NumPy
数组中?
谢谢
最佳答案
numpy.genfromtxt
或 numpy.loadtxt
都无法处理文件中的奇数列。如果您有权访问pandas
,它可以用pandas.read_table
做你需要的事情.
import pandas as pd
df = pd.read_table('myfile.txt',header=None,sep='\t')
# to get the data in a numpy ndarray:
myarray = df.values
默认情况下,缺失值被指定为 NaN
,但您可以使用 df.fillna(value)
进行更改
关于python - NumPy loadtxt(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31024958/