artificial-intelligence - 情感分析用其他语言

标签 artificial-intelligence nlp machine-learning sentiment-analysis

我选择的CSE毕业项目是一个模拟搜索引擎，该搜索引擎使用情感分析来评估评论/评论是否为正面/负面/中立

我不确定该怎么做，但是我知道它使用的是您首先训练的分类代理，然后它可以自己进行分类。边缘不高(我了解大约60％)

我的问题是，这是否适用于非英语语言？我的意思是我想对阿拉伯语注释/评论进行情感分析并生成适当的情感，使用当前的分类器是否可行？如果不是，我将需要编写自己的分类器，是否可以编写自定义分类器？

最佳答案

My question is, will that work on non-English languages? I mean I want to do sentiment analysis on Arabic comments/reviews and generate a proper sentiment, is it doable with the current classifiers?

您在这里有些困惑。您所谓的“分类代理”被适本地称为学习者。学习者接受训练集以产生分类器。可以将其应用于看不见的数据，以获得正面/负面/中立的分类。

为了使诸如此类的机器学习的NLP任务适应新的语言，您需要训练一个数据集。大多数情绪分析工具都需要标记集，这套标记集制作起来很昂贵，否则很难实现。因此，我建议您检查this answer中概述的非监督方法(unsupervised =从未标记的数据中学习)。该方法是用英语描述的，但是我听说在其他语言上已经取得了合理的结果。但是，YMMV基于您将要使用的确切数据集。

关于artificial-intelligence - 情感分析用其他语言，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7751269/

上一篇：machine-learning - 如何在sklearn的集成分类器中使用自定义分类器？

下一篇：regex - 帮助 : Extracting data tuples from text. .. 正则表达式还是机器学习？

相关文章：

java - 蒙特卡洛树搜索 UCT 实现

python - 如何在Python中调整gensim `LdaMulticore`的参数

python - 对服装照片进行分类有哪些好的特征？

validation - 如何解决验证准确率波动的问题？

python - 这两行如何工作 x2 = x+delta[i][0] , y2 = y+delta[i][1]？

python - 我无与伦比的井字游戏程序失败了

machine-learning - 构建决策树时的停止条件

machine-learning - 对相似的词组进行分类

nlp - keras 中 CNN 和 RNN 模型的集成

machine-learning - SVM 加载的训练模型的准确度明显较低；我们还需要保存 TokenCountVectorizer 吗？