当我尝试根据另一列的值有条件地更新数据框列时,出现以下错误。
ValueError: cannot set using a multi-index selection indexer with a different length than the value.
我花了几个小时也没能找出原因。以下是演示该问题的简化代码:
dfm = pd.DataFrame({'jim': [0, 0, 1, 1],
'joe': ['x', 'y', 'z', 'y'],
'jolie': np.random.rand(4),
'folie': np.random.rand(4)})
dfm = dfm.set_index(['jim', 'joe'])
dfm.loc[(dfm['jolie'] == 1) , 'jolie'] = dfm['folie']
一旦我删除了索引,上面最后一行代码就可以工作了。我的问题是:我做错了什么?上面的代码可以在不删除索引的情况下修复吗?这是 Pandas 的错误吗? 非常感谢您的帮助。
最佳答案
这里的问题很可能是因为 dfm.loc[(dfm['jolie'] == 1) , 'jolie']
的长度与 dfm 的长度不同['folie']
因为前者只查看 dfm['jolie']
的一个子系列。
另外,在给一个series赋值时,两者的索引必须匹配,无论是单索引还是多索引。
例如,以下将起作用:
dfm.loc[(dfm['jolie'] == 1) , 'jolie'] = dfm.loc[(dfm['jolie'] == 1) ,'folie']
关于python - 修复代码以摆脱 ValueError : cannot set using a multi-index selection indexer with a different length,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55543097/