我有两个数据集想要加入 book
柱子。然而,书名与第一个数据集有点不同。似乎没有明确的模式,但唯一的条件是: df1
中的书名是书名 df2
的子集。您有什么建议加入他们吗?
df1 <- tribble(
~book, ~sales,
"a", 100,
"bakora", 60,
"c", 40,
)
df2 <- tribble(
~book, ~sales,
"a.com", 100,
"bakorade", 60,
"c.zi", 60,
)
最佳答案
我们可以使用stringdist
library(fuzzyjoin)
stringdist_inner_join(df1, df2, by = 'book')
关于r - 如何加入相似字符的数据集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66430537/