富士通和麻省理工学院大脑、思维和机器中心 (CBMM) 的研究人员在寻求提高负责图像识别的AI 模型的准确性方面取得了“重大里程碑” 。
正如NeurIPS 2021上发表的一篇新论文所述,合作者开发了一种计算方法,该方法可以反映人脑,使 AI 能够识别其训练数据中不存在的信息(也称为分布外数据,或奇怪的)。
尽管 AI 已经用于一系列背景下的图像识别(例如医学 X 射线分析),但当前模型的性能对环境高度敏感。能够识别 ODD 的 AI 的重要性在于,在不完美的条件下仍能保持准确性——例如,当视角或光照水平与模型训练的图像不同时。
提高人工智能准确性
麻省理工学院和富士通通过将深度神经网络(DNN) 分成多个模块来实现这一壮举,每个模块负责识别不同的属性,例如形状或颜色,这类似于人脑处理视觉信息的方式。
根据针对 CLEVR-CoGenT 基准的测试,使用这种技术的 AI 模型在图像识别方面是迄今为止最准确的。
“这一成就标志着人工智能技术未来发展的一个重要里程碑,它可以为训练模型提供一种新工具,可以灵活应对不同情况,甚至可以高精度识别与原始训练数据差异很大的未知数据,我们期待期待它开启的令人兴奋的现实世界机会,”富士通研究员 Seishi Okamoto 博士说。
麻省理工学院大脑与认知科学系教授 Tomaso Poggio 博士说,受神经科学启发的计算原理也有可能克服数据库偏差等问题。
“在非分布条件下进行评估时,DNN 与人类之间存在显着差距,这严重损害了人工智能应用,尤其是在其安全性和公平性方面。迄今为止在该研究计划中获得的结果是[朝着解决此类问题]迈出的重要一步,”他说。
展望未来,富士通和 CBMM 表示,他们将尝试进一步完善他们的发现,努力开发能够做出灵活判断的 AI 模型,以期将其应用于制造和医疗等领域。