python - 比较 2 个句子并拆分为数据框

标签 python dataframe

例如有 2 列...

This is my original data frame

引用:['最初由 Gilly 发表,是吗?嗯嗯。我喜欢随机性。它改变了我的心情。我想并不是每个人都会以同样的方式使用react。 ;)']

all_post: ['最初由 Gilly 发布,是吗?嗯嗯。我喜欢随机性。它改变了我的心情。我想并不是每个人都会以同样的方式使用react。 ;) 啊好吧..也许我不明白../动物爬回洞里']

我想把句子分开

"Ah ok.. maybe I didn't understand.. /animal crawls back in its hole"

进入另一列

这是我尝试过的

def extract_post(Quote,Post):

    post = [x for x in all_post if x not in quote]

    return post

for j,row in confession.iterrows():
    if type(row['quote']) == float:
        continue
    else:
        print(extract_post(row['quote'], row['all_post']))

但是第二个的结果是 ['A', 'k', "'", '/', 'k'] (基本上它比较每个字符)

最佳答案

您只想从 all_post 中删除 quote 及其后面的空格。我们不需要为这个简单的任务定义函数。

        print(row['all_post'].replace(row['quote']+" ", ""))

关于python - 比较 2 个句子并拆分为数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58751394/

相关文章:

python - 如何通过python中的pandas导出到单个csv文件的多个excel表

python - 使用默认值预初始化 raw_input

android - 如何在不同的线程上运行不同的进程并将输出输出到第一个线程? Python

python - 如何从 pandas 数据框中的 bool 和 float 列计算新的矢量化列?

python - 数据帧 : each column in different plot in subplot

python - Pandas 设置列子集慢

python - 按 Dataframe 中的位置替换数组中的元素 - Pyspark

python - 如何使用 Python unittest 来测试类层次结构?

python - pygame Sprite 似乎拉伸(stretch)/增长而不是沿 x 轴移动

Python 字典创建语法