python - sklearn.ensemble.RandomForestClassifier 中的邻近度矩阵

标签 python scikit-learn random-forest

我正在尝试使用随机森林在 Python 中执行聚类。在随机森林的 R 实现中,您可以设置一个标志来获取邻近矩阵。我似乎无法在随机森林的 python scikit 版本中找到任何类似的东西。有谁知道 python 版本是否有等效的计算?

最佳答案

我们没有在 Scikit-Learn 中实现邻近矩阵(目前)。

但是,这可以依靠我们的决策树实现中提供的 apply 函数来完成。也就是说,对于数据集中的所有样本对,迭代森林中的决策树(通过 forest.estimators_)并计算它们落在同一片叶子中的次数,即多次 apply 为配对中的两个样本提供相同的节点 ID。

希望这对您有所帮助。

关于python - sklearn.ensemble.RandomForestClassifier 中的邻近度矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18703136/

相关文章:

python - 最小最大缩放后随机森林回归 MAPE 除以零误差

python - 在机器学习和深度学习项目中进行分析之前,我是否应该重新组合训练集和测试集?

python - sklearn随机森林索引feature_importances_如何做

python - 使用 python 3.6 异步的 UDP 代理服务器

python - 将 DataFrame 或一系列列表转换为一个堆叠的 DataFrame(或系列)

javascript - 在 Python 中执行 Javascript 浮点运算

python - 使用 Python 请求的 SSL 客户端身份验证

python - 在数据帧的列上使用 sklearn 的 LabelEncoder

python - F1 分数指标和分类报告 sklearn 的 F1 分数值不同

r - 随机森林错误 : "Need at least two classes to do classification"