我尝试使用 pandas.read_csv 读取带有缺失值的 .txt。我的数据是以下格式:
10/08/2012,12:10:10,name1,0.81,4.02,50;18.5701400N,4;07.7693770E,7.92,10.50,0.0106,4.30,0.0301
10/08/2012,12:10:11,name2,,,,,10.87,1.40,0.0099,9.70,0.0686
具有数千个具有相同点名、GPS 位置和其他读数的样本。 我使用一个代码:
myData = read_csv('~/data.txt', sep=',', na_values='')
代码是错误的,因为 na_values 没有给出 NaN 或其他指标。列应该具有相同的大小,但我以不同的长度结束。
我不知道在 na_values 之后应该输入什么(尝试了所有不同的东西)。 谢谢
最佳答案
参数 na_values
必须是“list like”(参见 answer)。
一个字符串是“类似列表”的,所以:
na_values='abc' # would transform the letters 'a', 'b' and 'c' each into `nan`
# is equivalent to
na_values=['a','b','c']
类似地:
na_values=''
# is equivalent to
na_values=[] # and this is not what you want!
这意味着您需要使用 na_values=['']
。
关于python - 在 python pandas 中读取缺失值的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12514590/