python - 在 python pandas 中读取缺失值的文件

我尝试使用 pandas.read_csv 读取带有缺失值的 .txt。我的数据是以下格式:

10/08/2012,12:10:10,name1,0.81,4.02,50;18.5701400N,4;07.7693770E,7.92,10.50,0.0106,4.30,0.0301
10/08/2012,12:10:11,name2,,,,,10.87,1.40,0.0099,9.70,0.0686

具有数千个具有相同点名、GPS 位置和其他读数的样本。我使用一个代码:

myData = read_csv('~/data.txt', sep=',', na_values='')

代码是错误的，因为 na_values 没有给出 NaN 或其他指标。列应该具有相同的大小，但我以不同的长度结束。

我不知道在 na_values 之后应该输入什么(尝试了所有不同的东西)。谢谢

最佳答案

参数 na_values 必须是“list like”(参见 answer)。

一个字符串是“类似列表”的，所以:

na_values='abc' # would transform the letters 'a', 'b' and 'c' each into `nan`
# is equivalent to
na_values=['a','b','c']

类似地:

na_values=''
# is equivalent to
na_values=[] # and this is not what you want!

这意味着您需要使用 na_values=['']。

关于python - 在 python pandas 中读取缺失值的文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12514590/

上一篇：python - 在 matplotlib 图中交互式选择系列

下一篇：python - 使用 opencv 和 ffmpeg 制作视频。如何找到合适的颜色格式？

python - 获取＆符号之间或末尾的字符串

python - 查找数据帧字符串中单词的交集 - 仅整个单词

python - 如何将 xarray 数据集转换为 dask 数据帧内的 pandas 数据帧

python - 建立一个函数来根据截止值删除数据集中的最小值和最大值？

python - 使用字典从列表中获取键和值

python - 如何识别 pandas 数据框中的非空列？

python - Pandas - 水平统一数据框，将行变成列

Python:在给定索引值处将数据帧插入到更大的数据帧中

python子进程卡在读取管道上