我正在尝试获取索引值以及列表中每个单词的数量超过 1 的情况。
Ref="easy to get to know to easy of to"
通过 Ref
输入,我的表为 df1
word Count
easy 2
to 4
get 1
know 1
of 1
而df
是
Index word
0 easy
1 to
2 get
3 to
4 know
5 to
6 easy
7 of
8 to
所以从这两个表df
和df1
我想要的是
Index word count
[0,6] easy 2
[1,3,5,8] to 4
[2] get 1
[4] know 1
[7] of 1
如果有人帮助我,那就太好了。
最佳答案
给定 df,为
word
Index
0 easy
1 to
2 get
3 to
4 know
5 to
6 easy
7 of
8 to
首先,使用 reset_index
将数据帧索引移动到名为“Index”的列中:
df = df.reset_index()
接下来使用以下groupby
和agg
:
df.groupby('word')['Index'].agg([list,'count']).reset_index()
输出:
word list count
0 easy [0, 6] 2
1 get [2] 1
2 know [4] 1
3 of [7] 1
4 to [1, 3, 5, 8] 4
关于python - 获取字数大于 1 的索引值组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51023435/