statistics - 椭圆体的 k 均值

标签 statistics machine-learning theory computational-geometry k-means

我在 R^3 中有 n 个点,我想用 k 个椭球体或圆柱体覆盖它们(我不在乎;以更容易的为准)。我想大约最小化卷的并集。假设 n 是数万,k 是少数。开发时间(即简单性)比运行时更重要。

显然我可以运行 k-means 并为我的椭球体使用完美的球。或者我可以运行 k 均值,然后使用每个簇的最小封闭椭球体,而不是用球覆盖,尽管在最坏的情况下这也好不了多少。我见过关于用 k 均值处理各向异性的讨论,但我看到的链接似乎认为我手头有一个张量;我不知道,我只知道数据将是椭球体的并集。有什么建议吗?

[编辑:有几票支持拟合多元高斯的混合,这似乎是一个可行的尝试。启动 EM 代码来执行此操作不会最小化联合的体积,但当然 k 均值也不会最小化体积。]

最佳答案

所以你可能知道 k-means 是 NP 难的,而且这个问题更普遍(更难)。因为您想要制作椭球体,所以拟合 k 个多元高斯分布的混合可能很有意义。您可能想尝试找到最大似然解,这是一种非凸优化,但至少它很容易制定并且可能有可用的代码。

除此之外,您可能必须从头开始编写自己的启发式搜索算法,这只是一项艰巨的任务。

关于statistics - 椭圆体的 k 均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7880156/

相关文章:

java - 在Java数学中选择函数?

theory - 生成 self 引用程序的工具?

python - scikit-learn:支持向量机。精度和/或准确度?

postgresql - 是否可以通过表确定 Postgres 写入速率(以每秒写入数为单位)?

python - 将重新缩放层(或与此相关的任何层)添加到经过训练的 tensorflow keras 模型

python - 如何在 Pandas 中获取盘中价格 - 成交量图?

c++ - dyld : Library not loaded: lib/libopencv_core. 3.0.dylib 原因:找不到图片

asp.net - 有没有办法知道是否有人为您的网站添加了书签?

python - Statsmodels - 线性回归模型 (OLS) 中系数趋势显着性的 Wald 检验

python - 标准正则表达式与 python 正则表达式差异