我刚拿起 Pandas 来做我生物学研究中的一些数据分析工作。原来我正在分析的一种蛋白质叫做“NA”。
我有一个矩阵,列标题上有成对的“HA、M1、M2、NA、NP...”,与“行标题”相同(对于可能阅读本文的生物学家,我正在与流感)。
当我将数据直接从 CSV 文件导入 Pandas 时,它会将“行标题”读取为“HA、M1、M2...”,然后将 NA 读取为 NaN。有什么办法可以阻止这种情况吗?列标题很好 - 'HA、M1、M2、NA、NP 等...'
最佳答案
以这种方式关闭 NaN 检测:pd.read_csv(filename, keep_default_na=False)
我最初建议使用 na_filter=False
,这样就可以完成工作。但是,如果我理解 Jeff 在下面的评论,那么这是一个更简洁的解决方案。
例子:
In [1]: pd.read_csv('test')
Out[1]:[4]: pd.read_csv('test', keep_default_na=False)
Out[4]:1 2
2 3
关于python - Pandas 将 'NA' 转换为 NaN,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16596188/