r - 如何删除数据框中包含 R 中某些单词的行?

标签 r dataframe rows words

我正在尝试删除数据框中包含某个单词或某些单词序列的行。例如:

mydf <- as.data.frame(read.xlsx("C:\\data.xlsx, 1, header=T"))
head(df)
#     NO    ARTICLE    
# 1   34    New York Times reports blabla
# 2   42    Financial Times reports blabla
# 3   21    Greenwire reports blabla
# 4    3    New York Times reports blabla
# 5   46    Newswire reports blabla

我想从我的 data.frame 中删除包含字符串“New York Times”和“Newswire”的行.我使用 %in% 尝试了不同的方法或 grep ,但我不太确定如何使用它!

我怎么做?

最佳答案

根据我的评论,使用 grepl ,当在您的向量中找到指定的字符串时,它将返回一个逻辑值。在您的情况下,例如:

df[!grepl('New York Times',df$Article),]

应该做的伎俩。

关于r - 如何删除数据框中包含 R 中某些单词的行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22127342/

相关文章:

windows - R Markdown v2 到 pdf。绘图中出现非拉丁字符时出现转换错误

python - dataframe.hist() 具有不同的 bin 大小

python - 使用多索引列标题从宽到长 reshape 数据框

postgresql - 对表格的每 3 行求和

r - 格式化 R 代码块中的文本

r - text2vec 的词干函数

sql - 根据相关行中的值更新列

android - 多行单选按钮

r - R-Server或Shiny Server是否为每个用户创建一个新的R进程/实例?

python - “DataFrameGroupBy”对象没有属性 'set_index'