我正在尝试使用以下命令对文件使用斯坦福 NLP 情感分析,每行都有一个新句子:
C:\Users\alonr\IdeaProjects\stanford-corenlp-full-2014-08-27>java -cp "*" -mx2g
edu.stanford.nlp.sentiment.SentimentPipeline -input TEXT -output PROBABILITIES -file
my_file.txt
不幸的是,它无法将文件中的换行符识别为句子换行符。我怎样才能做到这一点?
最佳答案
主程序 SentimentPipeline
未设置为允许更改句子拆分器。但是,如果您使用的是 Stanford CoreNLP:您可以使用 -ssplit.eolonly
标志运行 CoreNLP 主管道:
java -cp "*" -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP \
-annotators tokenize,ssplit,pos,parse,sentiment -ssplit.eolonly \
-inputFile my_input.txt -outputFormat text -outputFile my_file.txt
关于annotations - Stanford NLP Sentiment,句子换行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26697581/