Return to site

【Y视角】如何将“情感”可视化

每当我们在考虑将手中的数据以何种图表形式在PPT、Prezi甚至是Tableau中展现时,其实我们便是在研究数据科学领域常被提到的“数据可视化技术”,即如何借助于图形化手段清晰有效地传达与沟通信息。在当今信息泛滥的高互联高数字化时代,无可置疑,数据可视化已成为数据分析领域一项不可或缺的重要手段,是数据分析师想要从茫茫数据中挖掘重要意义时所必备的技能 。

从今天开始,我们会以专题文章的形式不定期地给大家带来一些语忆科技对各行各业数据可视化的理解和阐释,希望能给各位读者们在今后数据解读相关工作上带来稍许启发。

数据可视化是一个庞大的课题,随着数据对象及展现目的的不同,可视化的方法千差万别。今天我们所要重点讨论的便是“情感”大数据的可视化,所谓“情感”一直是一个非常难以表述的非结构化的数据,那当今的数据科学是如何将“情绪”数据可视化的呢?

情感可以数据可视化吗?

大数据时代一切皆可数据化,而人工智能的异军突起也在各个行业攻城略地。撇开纯理性的AlphaGo不谈,在感性的方面,DeepDream创作了大量的艺术作品,小冰发表了诗集等,似乎在人工智能的攻势下,那些人类引以为傲的壁垒正在土崩瓦解。

在所有这一切之后,情感似乎是人类最终的一道防线,究竟情感是不是生命体独有的,也成为了科技界争论的焦点。AI可以通过图像、声音、文字识别出人的情感,也可以通过不同的方式表达出特有的情绪。但这样一种建立在隐含复杂逻辑关系上的情感究竟能不能和人类真实情感划上等号,确实还难以得出定论。

那人类的情感能不能可视化呢?
答案是基本肯定的。虽然目前的AI技术还不足以完全模拟人的情感,但在识别情感与量化情感上已经有了很大的进展。

数据可视化是人类对一切量化信息的直觉展示,而当情感可以被人工智能近似地量化为数字后,可视化也就成为了可能。如同我们可以用语言描述出自己的情感一样,我们也可以使用数据与图表来近似表现情感。

情感模型

情感可视化的关键点在于对情感的建模。

Albert Mehrabian教授早在1974年提出了PAD情感模型,使用三个维度的数据(Pleasure-Arousal-Dominance)来表达情感。

PAD情感模型

  • Pleasure度量情绪的愉悦程度,判断情绪的正负面状态。比如愤怒和恐惧属于非愉悦情绪,而喜爱则属于愉悦情绪。
  • Arousal度量情绪的激烈程度。发狂比愤怒情感更为激烈,沮丧和难过虽然都属于负面情绪,但都是激烈程度相对较低。
  • Dominance度量情绪的控制程度。愤怒是可控情绪,而恐惧是不可控情绪。

PAD模型几乎涵盖了心理学上情感所能涉及的所有维度,通过三维坐标几乎可以表示所有情绪。这个模型也从最初只用于环境心理学,逐渐被别的领域所接受,在消费者市场营销领域也已有应用。

之后的1980年,心理学家Robert Plutchik提出了著名的情绪环的概念,用图形与色彩展现出了人类所具备的八种基础情绪:喜爱,信任,恐惧,惊讶,悲伤,厌恶,愤怒,期待。

Robert Plutchik情绪环

对于每一种情绪分别扩展到三个程度,总共形成24种主要情绪,越靠近内圈情绪越是激烈。在情绪环中越接近则情绪越相似。

另外利用这个环的特性,一些新的情绪也可以由这24种情绪进行重新组合:

比如“爱=愉悦+信任”,又比如“嫉妒=难过+愤怒”。

在这些基础的心理学模型的帮助下,使得情感量化在学术界和工程界都成为了可能,越来越多的情感模型层出不穷,进一步加强了情感可视化的发展。

EmoVis 2016

2016年ACM举办了第一次情感与可视化的大会EmoVis2016,专注于数据可视化在情感方向的应用,该会议属于ACM智能用户交互大会(IUI2016)的一个部分。

之所以是用户交互大会,是因为交互已经在可视化与视觉分析领域扮演了重要的角色。但是用户的情感状态却很少在这些交互技术中被体现出来。在很多场景下,如果自身或者他人的情感可以被可视化的话,往往有助于用户做出更好的决策。在情感数据的帮助下,可视化系统可以更深入人们的精神层面,从而展开更多可能性的探索。

在大会上,很多研究者把关注点放在了随着互联网发展不断增长的文本信息上。虽然人的情感特别复杂的,但是基本的维度其实可以简化为两个方向,正向与负向。对于互联网上大量的文字评论,比如豆瓣影评,我们可以很明显的感受到评论所表达出的积极情绪与消极情绪。正负面情绪里又可以细分为具体的基础情绪。

人们在互联网上的行为,例如评论或者微博,往往反映了了他们的情感,包括当时的情绪和长时间的心情。Dr. Michelle Zhou给出了总结了通过互联网上人们的文本内容对每个人进行情感建模的方法。给出了基于twitter时间轴的交互式情感可视化分析系统,提炼出Twitter用户心情变化曲线。

Twitter用户情感可视化系统

大会里也包含了很多有趣的作品:

博物馆情感体验之旅:通过可穿戴设备记录游客在游览博物馆的过程中观看展品时的情绪状态,并可视化展示。整个可视化系统建立在博物馆的3维地图上,使用不同的颜色来表示人们面对每一幅艺术作品的情感反馈。

博物馆情感之旅

个体与群体的兴奋程度可视化:提出了一种针对个体与群体兴奋程度的可视化方案,同时应用于实时状况与历史数据。监控群组中个体的当前兴奋程度;统计每个用户一段时间内的兴奋状态;基于用户间兴奋程度的相似性对用户聚类。

四个独立用户的情绪状态可视化

SYM(spot your mood) 定义情绪的标准化工具:是一种类似于PAD模型的标准化软件实现方式,通过用户的不断反馈持续校准系统的准确性,从而定义标准化情绪指数。

SYM工作流程

另外,大会中也提出了可视化设计研究中在声音领域中所面临的挑战,希望将声音的交互也加入到情感可视化系统中。

语忆的探索

语忆科技在情感可视化领域也在不断探索,在网络文学领域通过对于小说进行情感时间轴分析,从而判断高潮低潮章节,量化阅读体验。

另外,语忆也开放了单句中文文本的分析功能,对于单句中文文本实现量化的情感分析,可以在try.yuyidata.com进行体验。

尾声

随着情感识别技术的日益完善,必将引来越来越多的研究者与设计者通过技术手段探索人们的精神世界。让我们期待更多优秀的情感可视化系统,能够真正帮助提升消费者体验,帮助商业决策。

参考文献

  1. Proceedings of the 2016 EmoVis Conference on Emotion and Visualization
  2. Wikipedia: Emotion classification; PAD emotional state model; Contrasting and categorization of emotions.
  3. Pleasure, Arousal, Dominance: Mehrabian and Russell revisited
  4. Nature of Emotions

更多资讯,欢迎搜索我们的微信公众号:语忆情感实验室

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OKSubscriptions powered by Strikingly