python - Pandas 将 'NA' 转换为 NaN

标签 python pandas bioinformatics

我刚拿起 Pandas 来做我生物学研究中的一些数据分析工作。原来我正在分析的一种蛋白质叫做“NA”。

我有一个矩阵,列标题上有成对的“HA、M1、M2、NA、NP...”,与“行标题”相同(对于可能阅读本文的生物学家,我正在与流感)。

当我将数据直接从 CSV 文件导入 Pandas 时,它会将“行标题”读取为“HA、M1、M2...”,然后将 NA 读取为 NaN。有什么办法可以阻止这种情况吗?列标题很好 - 'HA、M1、M2、NA、NP 等...'

最佳答案

以这种方式关闭 NaN 检测:pd.read_csv(filename, keep_default_na=False)

我最初建议使用 na_filter=False,这样就可以完成工作。但是,如果我理解 Jeff 在下面的评论,那么这是一个更简洁的解决方案。

例子:

In [1]: pd.read_csv('test')
Out[1]:[4]: pd.read_csv('test', keep_default_na=False)
Out[4]:1   2
2   3

关于python - Pandas 将 'NA' 转换为 NaN,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16596188/

相关文章:

python - AWS EMR Spark Python 日志记录

Python:Pandas:获取不同列的所有组合及其频率

python - 字符串python元素的所有排列

python - 使用计数和百分比创建列联表 Pandas

python - 为什么pd.Series([np.nan])| pd.Series([True])计算是否为False?

matlab读取pandas生成的h5文件

python - 让 python 脚本检查缺少的模块并在缺少时安装

python - 对列表列表进行排序以查找共享变体

list - 如何交换序言列表中的三乘三元素?

r - 如何通过r中的阈值对匹配组进行计数