java - 在 java 中矢量化文本文件以进行 kmeans 聚类 java encog

标签 java vectorization k-means encog

我正在使用 java encog 机器学习库来运行 kmeans 聚类。问题是它只能用于数字数据。有没有一种方法可以将文本文件(数据)矢量化,以便我可以直接输入 kmeans 聚类算法。

我是这个领域的新手。感谢您的帮助。

最佳答案

尝试使用对象输出流 如下

ByteArrayOutputStream baos = new ByteArrayOutputStream();
ObjectOutputStream oos = new ObjectOutputStream(baos);
oos.writeObject("YOUR_TEXT");
oos.close();

关于java - 在 java 中矢量化文本文件以进行 kmeans 聚类 java encog,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30251356/

相关文章:

java - 如何使用java + spring代码连接MFT服务器与其余暴露的执行上传,下载和列出文件等操作

java - VisualVM - 不是有效的核心转储

java - 如何使用 junit mockito 覆盖匿名类重写方法

apache-spark - 为什么 Spark Mllib KMeans 算法非常慢?

r - Sample.int(m, k) 中的错误 : cannot take a sample larger than the population

scikit-learn - PCA 如何为 scikit learn 中的 Kmeans 算法给出中心

java - 如何使用 EJB 3.1 在我的测试中注入(inject) PesistenceContext?

python - CountVectorizer 矩阵随新的分类测试数据变化?

R:将循环转换为向量化执行以实现行之间的相关性

r - 使用矢量化函数过滤每个列表中的不同值