annotations - Stanford NLP Sentiment,句子换行

标签 annotations newline stanford-nlp sentiment-analysis

我正在尝试使用以下命令对文件使用斯坦福 NLP 情感分析,每行都有一个新句子:

C:\Users\alonr\IdeaProjects\stanford-corenlp-full-2014-08-27>java -cp "*" -mx2g
edu.stanford.nlp.sentiment.SentimentPipeline -input TEXT -output PROBABILITIES -file
my_file.txt

不幸的是,它无法将文件中的换行符识别为句子换行符。我怎样才能做到这一点?

最佳答案

主程序 SentimentPipeline 未设置为允许更改句子拆分器。但是,如果您使用的是 Stanford CoreNLP:您可以使用 -ssplit.eolonly 标志运行 CoreNLP 主管道:

java -cp "*" -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP \
    -annotators tokenize,ssplit,pos,parse,sentiment -ssplit.eolonly \
    -inputFile my_input.txt -outputFormat text -outputFile my_file.txt

关于annotations - Stanford NLP Sentiment,句子换行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26697581/

相关文章:

java - 我可以覆盖 jsr-303 验证注释吗

java - 如何使@Documented注释保留泛型信息?

git 确保每个文件末尾有换行符

java - 如何使用 CoreNLP 从字符串中创建 SemanticGraph 对象?

java - 这个版本的 findViewById() 是如何工作的?

java - 为什么缺少注释不会在运行时导致 ClassNotFoundException?

php - fwrite 不会断行

java - 正则表达式问题在解析时删除\n

java - 使用斯坦福自然语言处理分类器进行分词的文本分类器