python - Scikit-Learn:加载和转储多标签 SVMlight 格式

在 scikit-learn 中，提供了两个函数来加载和转储 SVM^light 格式的文件:

sklearn.datasets.load_svmlight_file 和 sklearn.datasets.dump_svmlight_file

文档显示(并且函数支持)load_svmlight_file 可以加载多标签数据，即目标类别用逗号分隔，而不是将单个类别作为目标。但是，dump_svmlight_file 似乎不支持这一点。

我是不是读错了，还是 dump_svmlight_file 出于某种原因不支持这个？甚至不可能通过传递带有基于字符串的目标值的 y 向量来“欺骗它”，因为文件编写器需要一个 float 作为值。转储文件代码可以在 https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/svmlight_format.py 找到从第 230 行到第 262 行。

最佳答案

没错，dump_svmlight_file 目前不支持多标签任务。那是一个遗漏；你可以为它提交一个错误报告，尽管一个好的补丁(拉取请求)会导致更快的行动。

(签名，该模块的作者之一。)

关于python - Scikit-Learn:加载和转储多标签 SVMlight 格式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17364220/

上一篇：python - gevent 中断请求/urllib2 超时

下一篇：Python 调用 C : how could C send Python's line number it has been called from?

相关文章：

python - 如何删除具有空值的特定行

python - scikit 认为简单的单向量输入数组不兼容

python - 有没有办法在没有目标标签的情况下对文本进行分类？

machine-learning - WEKA GUI 中没有包管理器

读取 libsvm 的训练数据后崩溃

java - 线程中的异常 "main"java.lang.ArrayIndexOutOfBoundsException : 3090 >= 3090 at java. util.Vector.elementAt

Python C 扩展 : method signatures for documentation?

python - 将相关资源与 TastyPie 相结合

python - 像plotly.express 中一样使用plotly.graph_objs 创建直方图

python-3.x - 如何在预测时使用主成分分析？