artificial-intelligence - 情感分析用其他语言

标签 artificial-intelligence nlp machine-learning sentiment-analysis

我选择的CSE毕业项目是一个模拟搜索引擎,该搜索引擎使用情感分析来评估评论/评论是否为正面/负面/中立

我不确定该怎么做,但是我知道它使用的是您首先训练的分类代理,然后它可以自己进行分类。边缘不高(我了解大约60%)

我的问题是,这是否适用于非英语语言?我的意思是我想对阿拉伯语注释/评论进行情感分析并生成适当的情感,使用当前的分类器是否可行?如果不是,我将需要编写自己的分类器,是否可以编写自定义分类器?

最佳答案

My question is, will that work on non-English languages? I mean I want to do sentiment analysis on Arabic comments/reviews and generate a proper sentiment, is it doable with the current classifiers?



您在这里有些困惑。您所谓的“分类代理”被适本地称为学习者。学习者接受训练集以产生分类器。可以将其应用于看不见的数据,以获得正面/负面/中立的分类。

为了使诸如此类的机器学习的NLP任务适应新的语言,您需要训练一个数据集。大多数情绪分析工具都需要标记集,这套标记集制作起来很昂贵,否则很难实现。因此,我建议您检查this answer中概述的非监督方法(unsupervised =从未标记的数据中学习)。该方法是用英语描述的,但是我听说在其他语言上已经取得了合理的结果。但是,YMMV基于您将要使用的确切数据集。

关于artificial-intelligence - 情感分析用其他语言,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7751269/

相关文章:

java - 蒙特卡洛树搜索 UCT 实现

python - 如何在Python中调整gensim `LdaMulticore`的参数

python - 对服装照片进行分类有哪些好的特征?

validation - 如何解决验证准确率波动的问题?

python - 这两行如何工作 x2 = x+delta[i][0] , y2 = y+delta[i][1]?

python - 我无与伦比的井字游戏程序失败了

machine-learning - 构建决策树时的停止条件

machine-learning - 对相似的词组进行分类

nlp - keras 中 CNN 和 RNN 模型的集成

machine-learning - SVM 加载的训练模型的准确度明显较低;我们还需要保存 TokenCountVectorizer 吗?