annotations - Stanford NLP Sentiment，句子换行

标签 annotations newline stanford-nlp sentiment-analysis

我正在尝试使用以下命令对文件使用斯坦福 NLP 情感分析，每行都有一个新句子:

C:\Users\alonr\IdeaProjects\stanford-corenlp-full-2014-08-27>java -cp "*" -mx2g
edu.stanford.nlp.sentiment.SentimentPipeline -input TEXT -output PROBABILITIES -file
my_file.txt

不幸的是，它无法将文件中的换行符识别为句子换行符。我怎样才能做到这一点？

最佳答案

主程序 SentimentPipeline 未设置为允许更改句子拆分器。但是，如果您使用的是 Stanford CoreNLP:您可以使用 -ssplit.eolonly 标志运行 CoreNLP 主管道:

java -cp "*" -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP \
    -annotators tokenize,ssplit,pos,parse,sentiment -ssplit.eolonly \
    -inputFile my_input.txt -outputFormat text -outputFile my_file.txt

关于annotations - Stanford NLP Sentiment，句子换行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26697581/

上一篇：knockout.js - Durandal 中的 Knockout Mapping 插件未定义

下一篇：推送到 Codeplex 时出现 TortoiseSVN 错误

相关文章：

java - 我可以覆盖 jsr-303 验证注释吗

java - 如何使@Documented注释保留泛型信息？

git 确保每个文件末尾有换行符

java - 如何使用 CoreNLP 从字符串中创建 SemanticGraph 对象？

java - 这个版本的 findViewById() 是如何工作的？

java - 为什么缺少注释不会在运行时导致 ClassNotFoundException？

php - fwrite 不会断行

java - 正则表达式问题在解析时删除\n

java - 使用斯坦福自然语言处理分类器进行分词的文本分类器