如果我有一组对象,其中一些共享某些离散属性(例如 A、B、C、D 设置为 1 或 0),我如何可视化数据集中这些属性的覆盖范围和重叠?
例如
id A B C D
1 34 1 0 0 1
2 56 1 1 1 1
3 14 0 0 1 1
4 90 0 0 1 0
我主要使用 R,并尝试了一些维恩图绘图包,但这并不能真正扩展到超过 5 个维度。
是否有另一个可视化包更适合这个?
最佳答案
我的建议可能不是出于您可视化数据集的最初目的,但这可能是一种可行的方法:考虑可视化任意两个观察值(行)之间的成对距离。由于您有二进制数据,您可以使用适合此数据类型的任何距离度量,例如,参见一篇题为“二进制相似性度量调查”的论文。之后,您可以考虑基于计算出的距离度量进行聚类,这样您就会拥有层次聚类结果中常用的热图和其他可视化工具。
关于r - 在 R 中可视化数据重叠的最佳方式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20651331/