请帮忙。
我有一个包含近 40k 数据点(行)的数据框,其中一列包含文本。例如,
ID Text
1 I love my mum I love my dad
2 I live in AB I used to live in CD
. .
. .
我希望它输出如下:
ID Text
1 I love my mum dad
2 I live in AB used to CD
. .
. .
我尝试了 unique()
和 make.unique()
但它们不起作用。
最佳答案
我猜您想从每个句子中删除任何重复的单词。如果是这种情况,您可以尝试:
txt<-c("I love my mum I love my dad","I live in AB I used to live in CD")
vapply(strsplit(txt,"\\s+"),function(x) paste(unique(x),collapse=" "),"")
#[1] "I love my mum dad" "I live in AB used to CD"
关于R:如何在数据框中输出唯一的字符串(文本)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35916670/