我正在尝试执行一些类别重叠分析并需要帮助。
我有由客户服务票组成的数据。门票上标有类别数据。票证可以包含多个类别标签。
我有一个提取票证 ID 和类别的查询。我得到多行包含多个类别的 ID。我正在寻找一种显示类别重叠的方法,例如:有多少票有类别 A、有 A 和 B、B 和 C 等。
我希望能够在 Excel 或 R 中执行此操作,以便可以轻松地将其合并到我的管理报告中。
我的查询输出示例如下:
category ticket_id
A 3975472
D 3975472
B 3975472
P 3969484
B 3969484
S 3969484
P 3968360
C 3968360
D 3964048
A 3964048
C 3963748
E 3963748
谢谢!
我希望获得如下输出:
最佳答案
在 Excel
中,您可以使用数据透视表执行此操作:
在R
中,假设数据位于名为df
的数据框中,您可以执行以下操作:
table(df$ticket_id, df$category)
# A B C D E P S
# 3963748 0 0 1 0 1 0 0
# 3964048 1 0 0 1 0 0 0
# 3968360 0 0 1 0 0 1 0
# 3969484 0 1 0 0 0 1 1
# 3975472 1 1 0 1 0 0 0
关于r - 类别重叠分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32188560/