python - Pandas str.split (' ' ) 返回 NaN

标签 python pandas

我从字典创建了以下 DataFrame:

                                                     clusters
OG1.5_1000  [6243|g1697.t1_CBS136243, 6243|g7411.t1_CBS136...
OG1.5_1001  [2003|g3159.t1_CBS132003, 2003|g4503.t1_CBS132...
OG1.5_1002  [4916|g1071.t1_CBS134916, 4916|g1248.t1_CBS134...
OG1.5_1003  [4916|g913.t1_CBS134916, 4920|g2467.t1_CBS1349...
OG1.5_1004  [2003|g2248.t1_CBS132003, 2003|g3254.t1_CBS132...
OG1.5_1005  [2003|g1615.t1_CBS132003, 2003|g1622.t1_CBS132...

当我尝试使用“,”作为分隔符进行拆分时,我得到的结果是多个“NaN”

df['clusters'].str.split(',')

OG1.5_1001    NaN
OG1.5_1002    NaN
OG1.5_1003    NaN
OG1.5_1004    NaN
OG1.5_1005    NaN

对我做错了什么有什么建议吗?或者我如何拆分“集群”列?

最佳答案

我认为需要 DataFrame 构造函数,因为在 clusters 中是 list:

#if one column DataFrame
df = pd.DataFrame(df['clusters'].values.tolist(), index=df.index)

#if multiple columns and need join new df to existing
df = df.join(pd.DataFrame(df.pop('clusters').values.tolist(), index=df.index))

关于python - Pandas str.split (' ' ) 返回 NaN,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50529269/

相关文章:

python - Python 中用于 float 的内置 pow() 和 math.pow() 之间的区别?

python - 将数据保存到磁盘与将数据存储在图中时,Altair 会更改图例的顺序

python - Pandas to_hdf 溢出错误

python - pandas 自定义 idxmax() 函数,具有特殊的相等性处理

Python - 使用 httplib 来 PUT JSON 数据

Python 字典中数组的交集

python - python中具有相同尺寸的2个数据帧的平均值

python - pandas 获取时间戳差异(以毫秒为单位)作为整数

python - 为什么 Dask 读取 parquet 文件的速度比 Pandas 读取相同 parquet 文件的速度慢很多?

python - 使用python将单元格数据拆分为多行