我正在尝试删除数据框中包含某个单词或某些单词序列的行。例如:
mydf <- as.data.frame(read.xlsx("C:\\data.xlsx, 1, header=T"))
head(df)
# NO ARTICLE
# 1 34 New York Times reports blabla
# 2 42 Financial Times reports blabla
# 3 21 Greenwire reports blabla
# 4 3 New York Times reports blabla
# 5 46 Newswire reports blabla
我想从我的
data.frame
中删除包含字符串“New York Times”和“Newswire”的行.我使用 %in%
尝试了不同的方法或 grep
,但我不太确定如何使用它!我怎么做?
最佳答案
根据我的评论,使用 grepl
,当在您的向量中找到指定的字符串时,它将返回一个逻辑值。在您的情况下,例如:
df[!grepl('New York Times',df$Article),]
应该做的伎俩。
关于r - 如何删除数据框中包含 R 中某些单词的行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22127342/