【全球播资讯】微软宣布放弃情绪识别技术，AI终究还是读不懂人心

2022-06-28 05:39:47来源：36氪

此前在2020年末，一则“戴头盔看房”的视频曾在网络中流传开来，但其中的主人公并非是在搞行为艺术，而是因为彼时售楼处大规模使用人脸识别系统，来区分出消费者是自然到访、还是经过了中介。自此开始，人脸识别技术的滥用不仅让大众抵触，也引发了监管层的警惕，更是直接导致了Meta方面在去年11月下线面部识别系统。

而在日前，又有一家科技巨头对于人工智能技术采集用户生物信息作出了让步。

微软方面在近日宣布，将停止销售基于人脸图像猜测用户情绪的技术，并将不再提供不受限制访问的人脸识别技术，以及限制其他面部识别程序的使用，以确保这些技术符合自己的人工智能道德准则。微软Azure的AI部门首席部门产品经理Sarah Bird在博客文章中表示，“这些努力引发了有关隐私的重要问题，对‘情绪’的定义缺乏共识，以及无法跨越使用案例、地区和人口统计学概括面部表情和情绪状态之间的联系。”

(相关资料图)

据悉，微软的AI情绪识别技术可以推断出受测者的情绪状态、性别、年龄、情绪，以及其他个人属性，也就是说其甚至已经实现了“察言观色”。事实上，根据英国《卫报》在2019年的相关报道显示，让AI来解读人类情绪已经成为一个规模达到200亿美元的产业，用AI分析消费者的情绪以及预测消费者的行为，或是用AI分析患者的心理健康等应用场景，都已经在逐步落地。

然而为什么如此有前景的技术，微软方面会主动选择放弃呢？这其实是因为在AI情绪识别的实践过程中，无论是从技术角度、还是伦理角度，都存在着不可忽视的缺陷，以至于暂时将其搁置是当下最好的解决方案。

事实上，AI能够“察言观色”，是以计算机视觉和面部表情识别（FER）为基础的。其中，计算机视觉技术能够让机器精确识别人类的面部信息，这也是实现人脸识别的技术基础；而面部表情识别，则是用来分析和解释机器所读取面部表情中蕴含的情绪。作为机器人的AI在觉醒、并产生“灵魂”前，程序依然是经过人类设计的，这就导致AI情绪识别的理论基础其实与人类“读空气”的理论基础一样，是融合了计算机科学与心理学的产物。

那么AI是如何读懂人类的情绪，并做到知人知面又知心呢？相信许多朋友都听过“微表情”这个名词，而其在互联网中则被描述为了一项能够让你“读心”的技术，尽管这显然是很夸张的说法，但其实并非没有科学依据。

据悉，心理学家Paul Ekman早在1976年就基于解剖学，建立了面部表情编码系统（FACS）。该系统按照人的面部肌肉，将人脸划分为大约46个既相互独立、又相互联系的运动单元（AU），并分析了这些运动单元的运动特征以及其所控制的主要区域，与之相关的表情。

例如人在生气时通常会皱眉、眼睑紧张、鼻孔张大，在害怕的时候会出现瞳孔变大、眉毛抬起、嘴巴大开。同时，Paul Ekman等心理学家以及达尔文认为，人类存在6种与生俱来的基本情绪系统，即恐惧、悲伤、愤怒、愉悦、惊讶和厌恶，更复杂的情绪则是这些基本情绪的衍生。而情绪识别技术则是以各种情绪对应的表情与面部肌肉动作为素材，通过标注对于表情对应的情绪标签来对机器进行训练和学习。

简而言之，通过计算机视觉技术，AI能够识别出人类面部肌肉的动作，再基于面部表情编码系统和基本情绪模型，来告诉AI这张图片上反应的是什么样的情绪，久而久之在海量数据的“灌溉”下，AI就能知道人类做出这个表情对应的是什么情绪。虽然看起来这套理论是自洽的，但如果基本情绪系统理论本身存在问题呢？

其实，基本情绪系统的跨文化一致性一直是学界争论的焦点，这种忽略了背景、文化和社会因素的情绪理论，也一直都有反对的声音。美国心理科学协会曾委托五位情感科学不同理论阵营的科学家，进行了数据收集与科学证明，以论证表情与情绪之间的关系。最终论文呈现出的结果，是情绪的表达方式多种多样，很难从一组简单的面部运动中可靠地推断出一个人的感受，也就是表情与情绪之间并没有可靠的科学依据，证明两者直接关联。

参与这一项目的美国东北大学心理学教授Lisa Feldman Barrett就表示，“他们（巨头）能检测到一张愤怒的脸，但这与察觉到愤怒的情绪是两码事”。事实上，基本情绪系统理论之所以被人工智能领域接纳，是因为它正好契合了机器学习的能力范围，六种固定不变情绪的框架下，大规模利用生成对抗网络（GAN）来进行无监督学习的AI情绪识别技术，当然就会迅速“成熟”。

如果仅仅是技术不成熟就罢了，在当下大众对于个人隐私重视程度不断加深，AI情绪识别这种不仅仅存在技术问题，而且与个人隐私关联紧密的技术，更是挑动了许多人的神经。毕竟大家如今对于面部识别就已经很警惕了，情绪这种更私人化的东西自然是更加不希望被科技巨头随意评判。所以在针对科技巨头的反垄断浪潮中，微软方面自然不想、也不愿意与大众对着干。

在机器学习大规模普及前，传统的算法技术局限于人类对于自身的表达，需要设计者明确计算机在给定条件下的给定动作，而现在的算法则突破了人类表达的局限性。这固然带来了效率上的飞跃，但算法虽然是模仿人的思维方式，却无法模仿人的伦理自主性，在算法实现的过程中排除了人类对于伦理逻辑与价值理性的追求。

所以这也是为什么越来越多人对于科技的观感开始趋于负面，并认为科技正在逐渐走向“邪恶”的原因了。

【本文图片来自网络】

标签：