machine-learning - 将文本文件转换为 ARFF 格式

标签 machine-learning classification weka document-classification arff

我知道如何使用 TextDirectoryLoader 将一组文本或网页文件转换为 arff 文件。

我想知道如何将单个文本文件转换为 Arff 文件。

任何帮助将不胜感激。

最佳答案

请说得更具体一些。无论如何:

  • 如果文件中的文本对应于单个文档(即, 单实例),那么您所需要做的就是替换所有“新行” 使用转义码 \n 使全文位于一行中, 然后手动格式化为带有单个文本属性和 单实例。

    如果文本对应于多个实例(例如文档),那么我 建议制作一个脚本将其分成几个文件并应用 TextDirectoryLoader。如果有任何特定的格式(例如 实例包含在 XML 标签中),您可以执行相同的操作(通过 利用 XML 格式),或者编写自定义 Loader WEKA 中的类来识别您的格式并构建实例对象。

如果您发布示例,会更容易获得更准确的建议。

关于machine-learning - 将文本文件转换为 ARFF 格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19699539/

相关文章:

python - 使用语义词表示(例如 word2vec)来构建分类器

java - 用于(moa PairedLearners)的示例代码

neural-network - 我应该如何解释不会过度拟合的神经网络?

tensorflow - 如何使用 tf.argmax

machine-learning - Q 学习网格世界场景

python-2.7 - 在Python Pandas中训练朴素贝叶斯的不同类型的功能

python - keras中的概率回归

java - 在Java中实现多维度的Adaboost

python - 过采样会导致模型过拟合吗?

java - eclipse 错误 : says build path is incomplete