sentiment-analysis - 如何应对 Twitter 情绪分析?

标签 sentiment-analysis

我希望您给我一些建议,以解决这个问题。在大学里,我一直在解决意见挖掘任务,但在 Twitter 上,方法就完全不同了。例如,我使用集成学习方法对用户对西类牙某酒店的意见进行分类。当然,我得到了一个带有积极和消极意见的训练集,然后我用测试集进行了测试。但现在,有了 Twitter,我发现这种分类非常困难。

  1. 我需要训练集吗?如果这个问题的答案是肯定的,你不觉得twitter太短暂了,如果我有那一套,我在未来话题上的表现会很差吗?

  2. 我正在考虑获取一本字典(主要是形容词)并将我的推文与它交叉并获得术语文档矩阵,但我没有分配给任何推特的类。此外,积极形容词和消极形容词可能会根据主题和时间而有所不同。那么,该如何处理呢?

  3. 如何处理语言问题?例如,我想研究用英语和西类牙语编写的推文,但要分开研究。

  4. 您建议使用哪种编程语言来做这样的事情?我一直在尝试使用 R 软件包,例如 tm、twitteR。

最佳答案

  1. 当然,我认为情绪的使用方式将在几个月内保持不变。最坏的情况是你重新标记并重新训练。根据我的经验,无监督学习在工业应用方面的记录很糟糕。
  2. 您需要一些情感/形容词词典来存储情感内容 - 有一些数据集,但我忘记它们在哪里。我可能已经用更好的信息回答了之前的问题。
  3. 只要写英文推文,构建语言分类器相当容易,但您想从小事做起,所以放轻松
  4. Python (NLTK),如果您想通过少量代码轻松完成此任务。 Java 拥有很好的 NLP 功能,但 Python 及其库对用户更加友好

关于sentiment-analysis - 如何应对 Twitter 情绪分析?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10416343/

相关文章:

java - 如何获得多个句子的整体情绪

machine-learning - 使用文本情感作为机器学习模型中的特征?

python - 在 Python 中根据 Textblob 的极性获取正面和负面的单词(情感分析)

python - python中进行情感分析时,使用什么数据结构来存储相应单词的情感计数?

python - 预期 conv1d_1_input 具有形状 (15, 512),但得到的数组具有形状 (4, 512)

python - 在大多数情况下,VADER polar_scores返回输出为“Neutral”

hadoop - pig :Twitter Sentiment Analysis

python - 情绪分析中的否定处理

nlp - 如何在情感分析中使用上下文相关语法?

python - 使用 TF-IDF 向量大小进行 NLP 情感分析