bt365手机平台-下载首页

  • 有bt365手机app认知科学家开发的人脸识别执行的计算机模型的一系列的计算的那逆转,计算机图形程序将使用生成的面部的二维表示的步骤。

    有bt365手机app认知科学家开发的人脸识别执行的计算机模型的一系列的计算的那逆转,计算机图形程序将使用生成的面部的二维表示的步骤。

    图像:研究人员礼貌

    全屏

视觉新模式

有bt365手机app认知科学家开发的人脸识别执行的计算机模型的一系列的计算的那逆转,计算机图形程序将使用生成的面部的二维表示的步骤。

面处理的计算机模型揭示大脑如何能你生产细节丰富的视觉表现如此之快。


记者联系

萨拉·麦克唐纳
电子邮件: s_mcd@mit.edu
电话:617-253-8923
bt365手机app新闻办公室

媒体资源

1张图片下载

媒体访问

媒体只能从本网站的桌面版本下载。

当我们打开我们的眼睛,我们看到立即的很详细我们的周围。大脑如何能够形成细节丰富的世界,这些表述等是视觉研究中的快速解决的最大难题之一。

世卫组织科学家研究大脑使用视觉的计算机模型试图复制ESTA现象,但到目前为止,主要的模式只能执行任务要简单得多:如挑选出一个物体或对杂乱背景的脸。现在,由bt365手机app认知科学家领导的研究小组已经制作了一个计算机模型捕捉人类视觉该系统的生成,从图像的快速详细的场景描述,并提供了一些洞察大脑是如何实现这种能力。

“我们试图在这工作做的是解释的看法如何能够不只是对图像的元件安装语义标签,这样更丰富,并探讨我们如何看到所有的物理世界的问题,说:”乔希特南鲍姆,计算认知科学教授,bt365手机app计算机科学和人工智能实验室(CSAIL)和中心的大脑,头脑中的一员,和机器(CBMM)。

新的模型的posits当大脑视觉接收输入,它迅速执行一系列即扭转即计算机图形程序将使用以生成脸部或其它物体的二维表示的步骤的计算。这种类型的模型,已知有效,因为逆图形(EIG)与来自在非人灵长类动物的大脑面选择性区域电记录相关现状好,这表明灵长类视觉系统可以以几乎相同的方式为所述计算机模型来组织研究人员说。

Ilker耶尔德勒姆,前bt365手机app博士后谁现在是心理学在耶鲁大学助理教授,是论文的主要作者,这在当今出现 科学的进步。 Winrich Freiwald和特南鲍姆,神经科学教授和行为在洛克菲勒大学,是这项研究的首席作者。马里奥belledonne,研究生在耶鲁大学,是一位作家也。

逆显卡

的大脑视觉系统的研究几十年来已经研究的很详细,如何输入光在视网膜上转化为凝聚力的场景。 ESTA的了解,帮助研究人员开发的计算机模型可以复制,那ESTA系统的方面,如面部或其他物体认识人工智能。

“视觉是大脑,我们理解是最好的,在人类和其他动物的功能方面,”特南鲍姆说。 “计算机视觉是人工智能的最成功的领域在这点之一。我们想当然现在可以看机图片和识别人脸非常好,并检测其他类型的对象“。

然而,即使是复杂的系统,这些人工智能不接近到什么人的视觉系统可以做到,耶尔德勒姆说。

“我们的大脑不只是检测的对象,还有那边,或把一个标签上识别并且一些东西,”我说。 “我们看到所有的形状,几何形状,表面,纹理的。我们看到了非常丰富的世界。“

一个多世纪以前,医生,物理学家和哲学家赫尔曼·冯·亥姆霍兹理论,大脑通过反转图像形成的过程中创建这些丰富的表示。我推测,视觉系统包括图像生成器使用的是,例如,以生产面,我们看到在梦想。 ESTA发电机反向运行将让大脑工作向后从图像和推断出什么样的脸型或其它物体会产生图像,研究人员说。

但是,剩余的问题:如何能在大脑执行这个过程中,反被称为图形,如此迅速?试图创造一种可以执行此壮举算法的计算机科学家,但最好以前的系统需要迭代处理的多个周期,以更长的时间比在100至200毫秒的大脑需要创造什么详细的,你看到的可视化表示。神经科学家相信知觉的大脑可以进行,因此实现快速由于前馈大多是通过分层组织几个神经处理层。

bt365手机app领导的团队打造出在九月一种特殊的深层神经网络模型显示神经层次如何推断出一个场景的基本功能快速 - 在这种情况下,特定的脸。相反,在计算机视觉中使用的标准深层神经网络,这是从标签的数据表明类的图像中的物体的培训,研究人员的网络是从反映的是什么场景下使用面大脑的内部表示模型训练的能样子。

他们的模型从而了解要反转由用于生成面的计算机图形程序执行的步骤。这些图形程序开始有独立面的三维表示,然后将其转换成二维图像,如从特定的视点看到的。这些图像可以任意的背景图像上放置的位置。研究人员推测,大脑的视觉,该系统愿你做类似的梦或变戏法当一个人的脸的精神形象。

他们的研究人员训练神经网络来深进行反向这些步骤 - 也就是说,它与2D图像开始,然后增加了功能:如质地,曲率和灯光,创造什么样的研究人员称之为“2.5D”表示。这些2.5D图像指定脸从业主角度来看的形状和颜色。那些被转换成3D表示。然后,哪一个不依赖于观点。

“模型给出了在大脑面的处理的系统级帐户,允许它看到图像,并在3D到达最终目的,其中包括形状和纹理的表示,通过一个重要2.5D图像的该中间阶段“耶尔德勒姆说。

性能模型

研究人员发现,该模型是由在猕猴的某些地区学习的大脑得到了他们的数据是一致的。发表在2010年的研究中,加州理工学院的Freiwald和D要么is曹记录在这些区域神经元的活动,并分析他们如何回应25分不同的面孔,来自七个不同的角度看到的。这项研究揭示了更高层次的加工面,现在MIT的研究小组hypothesizes对应其逆模型图形三个阶段三个阶段:粗略来算,2.5D视点依赖阶段;从桥到2.5至3D那个阶段;和面表示的3D视点不变的阶段。

“这是我们展示的定量和定性这两个三级大脑的反应特性似乎适合非常好前三名水平,我们已经建立了网络,”特南鲍姆说。

研究人员还对模型的性能相比于涉及从不同的角度认识的面孔任务的人的那个。当变得更硬任务ESTA改变通过去除面部的纹理,同时保持其形状,或扭曲的形状,同时保持相对纹理的研究人员面临的。这款新车型的表现更像人类,而不是在国家的最先进的面部识别软件,更多的证据ESTA模式,可能更接近于模仿人类视觉系统会发生什么使用的计算机模型。

“这项工作是令人兴奋,因为它可解释进入前馈神经网络表示人脸识别模型的中间阶段,”尼古拉斯Kriegesk要么te,在哥伦比亚大学心理学和神经科学教授,他并没有在研究涉及的说。 “他们的做法融合了古典的概念,即视觉反转的是如何生成的图像的模式,用现代深前馈网络。这是非常有趣的模式更好,解释ESTA神经表征和行为反应“。

研究人员现在计划继续其它图像测试的建模方法,包括对象不是面,调查是否反转图形的威力影响到大脑感觉又怎么解释其他类型的场景。此外,适应他们认为ESTA方法计算机视觉可能会导致性能更好的AI系统。

“如果我们能提出证据,可能这些模型对应于大脑工作方式的,怎么会是这样的工作导致了计算机视觉研究人员采取更多的重视,并在工程制图ESTA逆办法投入更多的资源来感知,”特南鲍姆说。 “大脑仍然是任何类型的机器的那丰富并迅速看待世界的黄金标准。”

这项研究是由该中心的大脑,思维,以及bt365手机app机械资助,美国国家科学基金会,美国国家眼科研究所,海军研究办公室,纽约干细胞基金会,丰田汽车研究所和三菱电机。


主题: 研究, 计算机视觉, 脑与认知科学, 中心的大脑思维和机器, 计算机科学和人工智能实验室(CSAIL), 科学学院, 工程学院, 美国国家科学基金会(NSF), 人工智能, 机器学习, 神经科学

回到顶部