Python如何删除包含列表作为元素的数据框中不需要的逗号

标签 python dataframe

我有一个数据框,其中包含列表作为我从现场测量中获得的元素。我正在处理每个列表以进行某些操作。令人惊讶的是,一些随机列表末尾有额外的逗号,这会停止整个过程。

df = 
index      data
0          [1.002,1.001,1,1.005,1.001,1.001,1]
1          [2.002,2.001,2,2.005,2.001,2.001,2,,]
2          [4.002,3.001,2,1.005,2.001,6.001,5]
3          [1.002,1.001,1,1.005,1.001,1.001,9,,]
4          [8.002,1.001,7,1.005,9.001,8.001,12]

我的数据框有 90000 行。索引 1 和 3 中给出了给出错误的示例行。这两个列表末尾有额外的逗号。我想从列表中删除那些额外的逗号。怎么做?

我现在的代码:

 for index, row in iv_df.iterrows():
       row['data'] = np.setdiff1d(row['data'],[,]) 

当前输出:

SyntaxError: invalid syntax

预期输出:

df = 
index      data
0          [1.002,1.001,1,1.005,1.001,1.001,1]
1          [2.002,2.001,2,2.005,2.001,2.001,2]
2          [4.002,3.001,2,1.005,2.001,6.001,5]
3          [1.002,1.001,1,1.005,1.001,1.001,9]
4          [8.002,1.001,7,1.005,9.001,8.001,12]

知道如何实现它吗?

最佳答案

df['data'] = df.data.replace(to_replace=r',,', value='', regex=True)
print(df)

关于Python如何删除包含列表作为元素的数据框中不需要的逗号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57965711/

相关文章:

python - 如何在 Matplotlib 中设置不相等的 x 轴间隔

python - 如何在 Python Seaborn 包中更改图形的大小

python - Peewee CompressedField 在 MySQL 数据库上被截断

pandas - 使用 apply 方法将 Python Pandas 数据帧列中的元组列表转换为列表字典

r - 保存和加载 data.frames

python - "Merging"具有共同维度的 numpy 数组

r - 如何从整体中提取数据框的一部分?

python - 如何在Python中使锯齿状数组变得整齐?

python - M2Crypto 解密和验证大电子邮件的性能不佳

python - 检查 10 个不同集合之间的共同元素