r - 如何加入相似字符的数据集?

标签 r dplyr tidyverse

我有两个数据集想要加入 book柱子。然而,书名与第一个数据集有点不同。似乎没有明确的模式,但唯一的条件是: df1 中的书名是书名 df2 的子集。您有什么建议加入他们吗?

df1 <- tribble(
  ~book, ~sales, 
  "a",   100,
  "bakora",    60,
  "c",  40,
)
df2 <- tribble(
  ~book, ~sales, 
  "a.com",   100,
  "bakorade",    60,
  "c.zi",    60,
)

最佳答案

我们可以使用stringdist

library(fuzzyjoin)
stringdist_inner_join(df1, df2, by = 'book')

关于r - 如何加入相似字符的数据集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66430537/

相关文章:

r - 获取数据集 R 包中所有对象名称的列表?

r - 在 R 中向量化使用唯一函数的 for 循环

r - 如何绘制多列 CSV 文件?

r - 如何为 data.frame 的每一行调用一个函数?

R - 将列值嵌套到单个向量列(类型列表)中

r - 查找并用星号替换单元格,*

在 R 中,如果满足条件,则将值替换为新值,如果不满足,则保持值相同

r - 使用 dplyr 过滤行总和时出错

r - 通过具有不同 ID 值的列扩展 R 中的数据框

r - 将 dplyr slice_sample 函数转换为基础 R