我在使用 MySQL 销售交易数据库中的交易 ID 计算 Jaccard 相似度以查找类似书籍时遇到了这个问题:
t1=Java、Ruby、C
t2=Java、C#、Python
t3= C#、VB、C
....等等
Java 交集的大小 = 2; (我们怎么才能找到它?)
联合的大小 = 3,(我们如何找到它?)
杰卡德相似度=(交集/并集)= 2/3
但我不明白如何找出两个 vector 的“交集”和“并集”或如何在 Java/JSP 中实现它。
请帮助我,非常感谢!
最佳答案
您需要使用标准之一 Set类(class)。您可以对集合进行交集、并集和大小计算。
关于java - 如何用Java或JSP实现Jaccard索引?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15228493/