人类的悲欢虽不相通，但情感分析模型读得懂

2021/2/2 14:10:54

编程Tag： 算法神经网络人工智能自然语言处理深度学习

本文主要是介绍人类的悲欢虽不相通，但情感分析模型读得懂，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

内容提要：社交媒体逐渐成为当今人们生活的一部分，而它也成为心理学家们进行研究的重要数据来源。与此同时，研究者也尝试利用自然语言处理、机器学习技术，来预测社交媒体用户的情绪波动。

原创：HyperAI超神经

关键词：自然语言处理心理学

去年突如其来的新冠疫情，深刻地影响着人们的生活。这一特殊的历史时期，社会大众的心理都变得敏感脆弱。

疫情期间减少外出和接触，使得民众把更多时间花在社交网络上。有些人不可避免地将工作和生活中的不如意，通过网络发泄给了别人。恐慌、焦虑、悲伤、无助等不良情绪也有所加重。

面对突发公共事件，社交媒体用户普遍出现了包括愤怒、害怕、担心、迷惘、悲伤等负面情绪

据调查显示，全球互联网用户平均每天花在社交媒体上的时间，达到 2 小时 22 分钟，社交媒体已经不限于社交功能，它们还成为了很多人记录心情、倾诉心事的阵地。

无论是国内的微信朋友圈、微博、QQ 空间等，还是国外的 Twitter、Instagram、Facebook，都承载了万千用户的状态。

而对于心理学研究者来说，这些社交媒体上的帖子，无疑为其提供了数量可观的研究数据。

来自斯坦福大学的研究员 Johannes Eichstaedt 和密歇根大学的 Aaron Weidman，在其最新研究中，使用自然语言处理工具，对 Facebook 用户的帖子进行分析。

研究表明，机器学习模型可以通过社交媒体洞察一个人的情绪与波动，其准确度与传统心理学的度量结果相当。

从字里行间，读懂你的喜怒哀乐

近年来，网络上的大量资料，已经成为人格科学中一个重要的数据来源。大量的研究表明，使用社交媒体资料，对人格相关维度进行分类十分有效。

Eichstaedt 和 Weidman 的最新研究，则为利用社交媒体大数据分析、跟踪人的心理状态，提供了一个前沿案例。

使用社交媒体语言跟踪心理状态的波动：基于每周情绪波动的案例研究

取样校准

作者使用「效价」和「唤起」这两个基本情绪维度，来评价 Facebook 上帖子的情绪。

注：「效价」和「唤起」是心理学中评价情绪的两个维度，前者表示感受到的积极/消极程度，区分正面和负面情绪；后者表示冷静/兴奋的程度。

他们首先让已经有心理学研究基础的人类研究助理，给一项早期研究中的 2895 条公开 Facebook 帖子做注释。

研究助力给每一条帖子的「效价」（valence）和「唤醒」（arousal）进行打分。采用 9 分制（对于「效价」，1=「消极」，9=「积极」，同样地，对于「唤起」，1=「低」，9=「高」）。

心理学研究助理为帖子所作出的「效价」和「唤起」注释

该情绪跟踪数据集已经公开：https://osf.io/pbjer/files/

完成这些评价之后，这些帖子被用于训练机器学习模型，该模型将能够预测哪种语言传达了哪种情感。

然后作者对这些评分数据进行了一系列模型的拟合，每一个模型都显示，「效价」和「唤起」之间可能存在的明显联系。

对于国内的 NLP 研究者来说，中文情感分析数据集则更为适用。因此，超神经为大家推荐一个来自 2014 NLPCC 的中文微博情感分析数据集。

该评测数据来自新浪微博，对于输入的整条微博，任务要求判断出该微博是否包含情绪。对包含情绪的微博，要求判别其情绪分类输出为 anger（愤怒）、disgust（厌恶）、fear（恐惧）、happiness（高兴）、like（喜好）、sadness（悲伤）、surprise（惊讶）。

数据集详细信息如下：

下载地址：_https://hyper.ai/datasets/14390_

模型创建

团队使用差异语言分析工具包 DLATK（Differential Language Analysis ToolKit），提取所选 Facebook 帖子中的语言特征，根据单词、短语出现的相对频率，保留了比偶然出现的短语频率高出三倍以上的词汇。最终过滤出 1439 个句子成分用来预测「效价」，675 个句子成分预测「唤起」。

接着，训练一个基于整个语言特征集的脊回归模型，来预测「效价」和「唤起」，并使用 10 倍交叉验证（即在 90% 的数据上建立模型，然后在剩余的 10% 上进行评估）。

该模型的交叉验证样本外预测准确率为：「效价」预测准确率 0.63；「唤起」准确率为 0.82。与之前其他标准的情感测量方法相比较，发现该模型比这些替代测量方法估计得更准确。

验证样本

为了测试该模型，研究团队又从超过 6.5 万条 Facebook 帖子中，抽取了 640 个美国用户，男女人数相当，还需要满足的条件为：至少连续 14 周的时间里，发布 10 条以上的状态。

最终，研究团队收集了这些用户发布的 303575 个帖子作为验证样本。

实验结果

作者对用户的情绪评价进行了可视化，如下图，描述了一个女性（左）和一个男性（右）的每周情绪和唤醒波动，以及五大人格特征预测。

注：五大人格特征是现代心理学中，用于人格特质描述的结构模型。包括：外向性、神经质、亲和性、尽责性和经验开放性。

横坐标为「效价」值，纵坐标为「唤起」值

从图中看到，左边的女性用户情绪波动较大，并且出现高度愉悦（Valence）、高度兴奋（Arousal）的频率较高。

相比之下，右边的男性用户，情绪波动较小，很少经历高度愉悦或高度兴奋的情绪。

这也是团队实验中的一个新发现：女性往往比男性更乐观、情绪变化范围更广。这与

另外，团队分析还发现了「效价」和「唤起」值和五大人格之间的相关性。

模型评估

提供验证样本的 Facebook 用户，之前都自愿参与了「我的性格」的问卷调查，测评了其五大性格特征。

结果显示，机器学习模型对他们性格的预测，与使用心理学调查方法的预测一致。

缺陷分析

当然，作者也指出了这一模型目前所存在的问题。

首先，他们以比较活跃的 Facebook 用户作为样本，但是之所以选择他们是因为他们提供了足够频繁的状态更新，但他们并不可能代表所有美国人。

其次，不同社交平台，具有不同的属性与风格，使用 Facebook 帖子所获得的成果，能否在不同社交媒体比如 Twitter 上进行复制，还是个未知数。

因此，这些局限性、普适性问题，也都是研究者未来要进一步探索的方向。

社交平台用于心理学，潜力无限

也许对于很多人来说，社交平台无非是一个分享生活、美照、看八卦的地方，但事实上它在心理学研究中拥有着巨大的潜力。

通过数据挖掘、机器学习，能够从巨量的数据中提取信号，识别出患有抑郁症、焦虑症等情绪障碍的人，然后及时采取一些治疗措施。在这方面，国内也已经有成熟案例。

荷兰阿姆斯特丹自由大学（Vrije Universiteit Amsterdam）人工智能学者黄智生，于 2018 年创建了一个叫做「树洞救援队」的 AI 程序，在微博上搜寻有自杀倾向的帖子，然后通过「蛛丝马迹」锁定有轻生念头的用户的位置，及时派出救援志愿者前去寻找和疏导。

现在这支有志愿者组成的小队，还活跃在心理疏导的一线。

截至 2020 年 9 月底，成立两年时间以来「树洞救援队」共阻止了 3289 次自杀行为

另外，基于社交媒体的情感分析技术，还可以追踪创伤性事件（比如大地震、战争、新冠肺炎疫情等），对人们的心理影响，从而帮助政府部门有效开展舆情疏导、科学施救和民众情绪的安抚工作。

而对于个人来说，也许未来可以利用这些工具，分析分析男/女朋友的小情绪呢，大家就再也不用猜来猜去了~

新闻来源：

https://hai.stanford.edu/blog...

这篇关于人类的悲欢虽不相通，但情感分析模型读得懂的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

人类的悲欢虽不相通，但情感分析模型读得懂

从字里行间，读懂你的喜怒哀乐

社交平台用于心理学，潜力无限

相关编程文章