python - 句子被标记为 pandas 中的单词,但索引从 0 到第一个句子的长度,第二个句子又从 0 开始

标签 python

我有一个 python df,

     DF1 = Index  Words    Tags
             0      I       O
             1     Love     B
             2     India    I
             0    Flowers   B
             1      are     O
             2   Beautiful  B

我想要的输出是,

   DF1 = Index  Words    Tags   Sent
             0      I       O    1
             1     Love     B    1
             2     India    I    1
             0    Flowers   B    2
             1      are     O    2
             2   Beautiful  B    2

我想要一个 df

最佳答案

试试这个,pandas.DataFrame.Shift创建 bool 掩码并应用 pandas.Series.cumsum .

df['Sent'] = (df.Index - df.Index.shift()).lt(0).cumsum() + 1

   Index      Words Tags  Sent
0      0          I    O     1
1      1       Love    B     1
2      2      India    I     1
3      0    Flowers    B     2
4      1        are    O     2
5      2  Beautiful    B     2

关于python - 句子被标记为 pandas 中的单词,但索引从 0 到第一个句子的长度,第二个句子又从 0 开始,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63424430/

相关文章:

C# 获取访问属性

python - pylab scilimits 不工作

python - 在 matplotlib 中用箭头绘制相空间轨迹

python - 大 O 包含两个相乘的变量

python - 使用 Postman 与请求发布到 Flask 会填充不同的请求属性

python - 匹配 Pandas 中字符和数字的混合

python - 如何在 Microsoft Windows 上安装 Python 包 pyrouge?

python 字符串剥离不适用于尾随双引号

python - 模块未找到错误 : No module named 'sklearn.cross_validation' ??如何修复它?

python - 为什么这个 elif 语句会抛出错误?