我有一个数据框,其中包含列表作为我从现场测量中获得的元素。我正在处理每个列表以进行某些操作。令人惊讶的是,一些随机列表末尾有额外的逗号,这会停止整个过程。
df =
index data
0 [1.002,1.001,1,1.005,1.001,1.001,1]
1 [2.002,2.001,2,2.005,2.001,2.001,2,,]
2 [4.002,3.001,2,1.005,2.001,6.001,5]
3 [1.002,1.001,1,1.005,1.001,1.001,9,,]
4 [8.002,1.001,7,1.005,9.001,8.001,12]
我的数据框有 90000 行。索引 1 和 3 中给出了给出错误的示例行。这两个列表末尾有额外的逗号。我想从列表中删除那些额外的逗号。怎么做?
我现在的代码:
for index, row in iv_df.iterrows():
row['data'] = np.setdiff1d(row['data'],[,])
当前输出:
SyntaxError: invalid syntax
预期输出:
df =
index data
0 [1.002,1.001,1,1.005,1.001,1.001,1]
1 [2.002,2.001,2,2.005,2.001,2.001,2]
2 [4.002,3.001,2,1.005,2.001,6.001,5]
3 [1.002,1.001,1,1.005,1.001,1.001,9]
4 [8.002,1.001,7,1.005,9.001,8.001,12]
知道如何实现它吗?
最佳答案
df['data'] = df.data.replace(to_replace=r',,', value='', regex=True)
print(df)
关于Python如何删除包含列表作为元素的数据框中不需要的逗号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57965711/