python - 将表情符号添加到 AFINN 库以进行情感分析

标签 python python-2.7 sentiment-analysis

如何将表情符号添加到 AFINN 库

我想将表情符号添加到AFINN库中进行情感分析,该库已经有具有各自极性的单词,如何附加一些表情符号以便各自的代码可以读取其极性???

afinn = dict(map(lambda (w, s): (w, int(s)), [ 
        ws.strip().split('\t') for ws in open(filenameAFINN) ]))
pattern_split = re.compile(r"\W+")
def sentiment(text):
    words = pattern_split.split(text.lower())
    sentiments = map(lambda word: afinn.get(word, 0), words)
    if sentiments:
        sentiment = float(sum(sentiments))/math.sqrt(len(sentiments))
    else:
        sentiment = 0
    return sentiment
if __name__ == '__main__':
    print("%s") % (text)
    print ("%6.2f") % (sentiment(text))
    if sentiment(text) < 0:
        print "================||| NEGATIVE |||================"
    elif sentiment(text) > 0:
        print "================||| POSITIVE |||================"
    else:
        print "================||| Seems NEUTRAL |||================"  

图书馆里有按顺序排列的单词,比如。

yucky   -2
yummy   3
zealot  -2
zealots -2
zealous 2

我应该如何在库中添加这些表情符号,并读取其极性

(^ ^)   1
(^-^)   1
(^.^)   1

最佳答案

我是 AFINN 单词表背后的人。我的名为 afinn 的 Python 包已经具有一些表情符号。

>>> afinn = Afinn(emoticons=True)
>>> afinn.score('I saw that yesterday :)')
2.0

您可以在此处获取 afinn Python 包:

https://github.com/fnielsen/afinn

或者来自Python包索引

https://pypi.python.org/pypi/afinn/

有一个文件,里面有我的表情符号评分。在 GitHub 上,您可以在这里找到它:

https://github.com/fnielsen/afinn/blob/master/afinn/data/AFINN-emoticon-8.txt

如果您想添加自己的表情符号,我想目前不太麻烦的方法是在复制/ fork afinn 版本后扩展表情符号文件。

关于python - 将表情符号添加到 AFINN 库以进行情感分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35840083/

相关文章:

Python循环遍历字符串并将其与通配符模式匹配

java - 使用 Spark 的 MapReduce 调用不同的函数并聚合

python-3.x - 从两个不完整的、大小不同的数据帧创建日期数据帧

python - Tensorflow 启动速度快,训练过程中速度减慢

Python TCP 服务器向所有客户端发送消息

python - 除了交换系统变量 'PATH' 中 python 文件夹的路径顺序之外,还有哪些方法可以交换 python 版本?

javascript - 无法在 html 代码中找到表单 - 使用 Python 和 Selenium 进行 Web 抓取

python - 如何从 python 中检查计算机上是否安装了 LaTeX 和 TeX Live?

python-2.7 - 使用 systemd 运行时 pygame.init() 失败

hadoop - Hive:如何拥有存储来自情绪分析 API 的情绪值的派生列