apache-spark - 使用 Spark 和斯坦福 NLP API 进行情感分析

标签 apache-spark bigdata stanford-nlp sentiment-analysis

当我想做一个情感分析项目时,我在网上搜索了很多,最后我登陆了这个网站,它解释了代码,但它没有解释如何在代码中使用 Spark,我的意思是在哪里添加代码。 网站:http://stdatalabs.blogspot.in/2017/09/twitter-sentiment-analysis-using-spark.html?m=1

如果有人能完整地解释我,这将会有很大的帮助,因为我是初学者,这是我的第一个大数据项目。 谢谢。

最佳答案

底部有一个指向 github ( https://github.com/stdatalabs/sparkNLP-elasticsearch ) 的链接,您应该检查一下(字面意思)

主要类是 com.stdatalabs.SparkES.TwitterSentimentAnalysis 根据pom.xml

因此运行mvn package将生成一个可执行的.jar(用户java -jar)

运行 jar 会提示您输入一些 twitter 配置( key 等),并使用硬编码索引(和映射)保存到本地 es 集群twitter_020717/tweet

您现在可以随意更改代码、构建、运行并检查结果。

关于apache-spark - 使用 Spark 和斯坦福 NLP API 进行情感分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50163569/

相关文章:

apache-spark - 使用 spark-xml 从 pyspark 数据框中选择嵌套列

azure - 何时适合在 Spark 批处理作业中截断 RDD 图的谱系

apache-spark - 通过保留顺序,根据 id 列将 Spark DataFrame 拆分为两个 DataFrame(70% 和 30%)

stanford-nlp - 使用 CoreNLP 对法语进行依赖解析

apache-spark - 如何设置 pod 以使用所有可用的 CPU 内核

hadoop - 如何使用一个 reducer 的输出作为另一个映射器的输入?

hadoop - 无法安装Pig版本0.17.0;错误:无法找到Pig-core-h2.jar。做 'ant jar',然后再试一次

matlab - 在 Matlab 中将不同的数组分配给 3D 矩阵

java - Stanford Parser - 使用德语模型 jar

python - spacy en_core_web_lg 缺少停用词