java - 读取输入文件以发布标签

标签 java file-io pos-tagger

我有一个文本文件,我想阅读该文件

FileInputStream fstream = new FileInputStream(s);               
BufferedReader br = new BufferedReader(new InputStreamReader(fstream));

MaxentTagger tagger = new MaxentTagger("tag/wsj-0-18-bidirectional-distsim.tagger");    
String tagged = tagger.tagString(br);

我的问题是它应该读取文件并逐行将文件作为字符串提供给标记器并在输出文件中打印。

最佳答案

因为输入和输出都是文本,所以我会使用 ReaderWriter 而不是流。像这样的东西:

try (
  BufferedReader in = new BufferedReader(new FileReader("inputFile.txt"));
  PrintWriter out = new PrinterWriter(new FileWriter("outputFile.txt"));
) {

  MaxentTagger tagger = new MaxentTagger("tag/wsj-0-18-bidirectional-distsim.tagger");    
  String line;
  while ((line = in.readLine()) != null) {
    String tagged = tagger.tagString(line);
    out.println(tagged);
  }
}

请注意,此代码使用 Java 7 资源处理,因此 inout 会自动关闭。

关于java - 读取输入文件以发布标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13098324/

相关文章:

java Spark框架无法设置或读取cookie

c# - 快速访问文件中的 key (无需将整个文件加载到内存中)

c++ - CFile 读取 0 个字节

java - 涉及多种类型变量的计算

Java 的 "Scanner"方法 vs. Facade GoF 设计模式

python - 从词干词中获取最接近的名词

nlp - 如何使用斯坦福 CoreNLP NER 和 POS 标记预标记化文本?

java - 将斯坦福 POS 标记器实现为 .jar 的 Java 应用程序在运行时遇到问题,但在 NetBeans IDE 中运行良好

java - %~dp0 在名称中带有空格的文件夹下使用时不起作用

.net - 如何在 F# 中的 .txt 文件中间添加一行