我知道如何使用 TextDirectoryLoader 将一组文本或网页文件转换为 arff 文件。
我想知道如何将单个文本文件转换为 Arff 文件。
任何帮助将不胜感激。
最佳答案
请说得更具体一些。无论如何:
如果文件中的文本对应于单个文档(即, 单实例),那么您所需要做的就是替换所有“新行” 使用转义码
\n
使全文位于一行中, 然后手动格式化为带有单个文本属性和 单实例。如果文本对应于多个实例(例如文档),那么我 建议制作一个脚本将其分成几个文件并应用
TextDirectoryLoader
。如果有任何特定的格式(例如 实例包含在 XML 标签中),您可以执行相同的操作(通过 利用 XML 格式),或者编写自定义 Loader WEKA 中的类来识别您的格式并构建实例对象。
如果您发布示例,会更容易获得更准确的建议。
关于machine-learning - 将文本文件转换为 ARFF 格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19699539/