常识AI:使深度学习技术更人性化

  近年来,人工智能技术变得越来越复杂。现在,如此众多的产品和服务都依靠技术来提供自动化和智能,以至于它与我们的日常生活密不可分。无论是通过我们用来在家里提供便利的设备还是我们一直使用的产品的制造方式,其影响无处不在,从而推动了我们生活中各个方面的创新。但是,这个难题中有一些遗漏的部分仍然会给用户带来挫败感,并为试图改善AI技术性能的研究人员提出了严峻的挑战。

  常识人工智能

  微软联合创始人保罗·艾伦(Paul Allen)在2018年去世之前,投入了大量的时间和资源来解决似乎又一次又一次出现的重大挑战:人工智能技术中基本缺乏常识。艾伦先生,他的艾伦研究所人工智能(AI2)推出马赛克继续解决这一问题,陷害像这样:

  “在AI研究初期,人们对常识的关注很多,但是这项工作停滞了。人工智能仍然缺乏大多数10岁孩子拥有的东西:普通常识。我们希望迅速开展这项研究,以在该领域取得重大突破。”

  艾伦的类比凸显了深度学习技术当前状态的一个大问题。尽管我们的AI产品通常很智能,但它们仍然无法回答我们可能会问到同事或配偶的较简单的问题。例如,“如果我将这堵墙漆成红色,明天还会变成红色吗?” 为了说明我们须解决的距离,AI2的执行官Oren Etzioni举了一个例子:“当AlphaGo在2016年击败围棋玩家时,程序不知道围棋是棋盘游戏。” 在我们解决这个问题之前,人工智能的成功潜力将限于狭窄的应用。

  解决常识问题的复杂方法

  显而易见的是,有必要采用常识性AI的多管齐下的策略来突破技术的局限性。为此,艾伦(Allen)的Mosaic项目“整合了机器阅读和推理,自然语言理解,计算机视觉以及众包技术,从而为未来的AI系统建立了新的广泛的基础常识知识库。” 对于像AI2这样的组织,在研究层面上这是什么样的?

  视觉常识推理(VCR)是一项新的任务,是用于认知级视觉理解的大规模数据集。该研究专注于为基于AI的视觉系统创建高阶认知和常识推理。VCR是华盛顿大学和AI2研究人员之间的一项努力。VCR使用了一群人群工作者来注释该项目的数据。

  常识知识图提供了一种表示常识概念的半结构化方式。与其他知识来源相比,这种结构提供了不同的观点,但是,代表什么类型的知识以及如何较好地将其纳入现代神经网络仍然是该领域研究的重要问题。为了解决这个问题,团队目前正在构建和发布资源,以探索常识的各个方面,例如有关社会状况,心理状态和因果关系的信息。

  SWAG大规模数据集可完成扎根的常识推理,统一自然语言推理和扎根的推理。数据集包括有关基础情况的113k个选择题。每个问题都是来自LSMDC或ActivityNet字幕的视频字幕,其中有四个答案可供选择,以解决场景中接下来可能发生的情况。正确的答案是视频中下一个事件的(真实)视频标题;这三个错误的答案是对抗性地产生并经过人工验证的,目的是愚弄机器而不是人类。该团队的目标是使SWAG成为评估扎实的常识NLI和学习表示形式的基准。