bt365手机平台-下载首页

  • bt365手机app的研究人员利用机器学习找到编码探索全新的算法。他们的机器设计的算法跑赢大范围的这里显示的模拟任务和环境的人性化设计的算法。

    bt365手机app的研究人员利用机器学习找到编码探索全新的算法。他们的机器设计的算法跑赢大范围的这里显示的模拟任务和环境的人性化设计的算法。

    马丁·施奈德的形象礼貌。

    全屏

对于自动化全新的“好奇心”的算法搜索

bt365手机app的研究人员利用机器学习找到编码探索全新的算法。他们的机器设计的算法跑赢大范围的这里显示的模拟任务和环境的人性化设计的算法。

研究表明,计算机可以“写”的算法,适应完全不同的环境中,比人类设计的算法更好。


记者联系

金·马蒂诺
电子邮件: kimmarti@mit.edu
电话:617-710-5216
bt365手机app追求情报

通过一种与生俱来的好奇心驱使,孩子们拿起他们探索世界的新技能,并从他们的经验中学习。电脑,相比之下,当扔进新的环境往往会被卡住。

要解决这个问题,工程师们已经尝试过编码的好奇心简单的形式进入他们的希望与算法的代理人推到探索将更加有效地了解其环境。与孩子的好奇心代理可能会去借鉴回暖,操纵,并抛出对象理解引力,一个实现,可以大大加快其学习很多其他的事情的能力。 

工程师们发现编码好奇探索机器学习算法的许多方面。 ,一个研究小组在bt365手机app想知道,如果一台计算机可以做的更好基础上寻找新的算法,争取计算机的悠久历史。 

近年来,深层神经网络,通过调整数字参数寻求解决算法的设计,已实现自动化与像谷歌的automl和自动sklearn在Python软件。这使得它更容易对非专业人士,开发人工智能应用。但在深网练成了具体的任务,他们很难推广到新的情况。在代码中表示,在高级语言,相比之下算法,具有跨越不同的任务和环境的能力,以传授知识。 

“人类设计的算法是非常普遍的,”研究的共同作者说 费兰ALET,一名研究生在电气工程和计算机科学和计算机科学和人工智能实验室(CSAIL)的bt365手机app的部门。 “我们启发,利用人工智能找到了好奇的策略,能够适应各种环境下的算法。”

研究人员创建了产生52000种探索算法“元学习”算法。他们发现,上面两个是全新的 - 看似太明显或违反直觉的已经提出了一个人。既生成算法探索行为显着改善学习范围的模拟任务,从导航基于图像来使机器人步行蚂蚁的二维网格。因为元学习过程产生的高级别计算机代码作为输出,这两种算法可以被解剖,以他们的决策过程内窥视。

该论文的资深作者是 莱斯利kaelbling 和 托马斯洛萨诺 - 佩雷斯在bt365手机app计算机科学和电子工程两个教授。该工作将在虚拟呈现 学习交涉国际会议 本月晚些时候。 

本文来自未参与工作的研究人员的一致好评。 “用节目搜索来发现更好的内在奖励是非常有创意,说:”富国乐,在谷歌首席科学家谁帮助深学习模式的先锋计算机辅助设计。 “我喜欢这个主意了很多,特别是因为程序是可解释的。”

研究人员他们的自动算法设计过程比较文字数量有限写句子。他们开始通过选择一组基本构建模块来定义他们的探索算法。研究其他的好奇心算法的灵感后,他们选择了近30项高层次的业务,包括基本程序和深度学习模式,引导代理商做这样的事情还记得以前的输入,比较当前和过去的输入,并使用学习方法来改变它自己的模块。计算机然后每次合并多达七个操作创建一个描述52000种算法计算图。 

即使有一个快速的电脑,测试它们都将采取几十年。所以,相反,研究人员首先排除了预测表现不佳算法限制他们的搜索,基于他们的代码结构孤单。然后,他们测试了需要大量的探索,但最小的计算基础网格导航任务的最有希望的候选人。如果候选人做的很好,它的性能成为了新的基准,消除甚至更多的候选人。 

四台机器上搜索10小时找到最好的算法。超过99%是垃圾,但大约一百人明智的,高性能的算法。显着地,顶部16都是新颖的和有用的,在一个范围内的其他虚拟任务比,人设计的算法执行以及,或更好,从登陆月亮流动站提高机器人臂和在移动的蚂蚁状机器人物理模拟。 

所有16种算法共享两个基本勘探功能。 

第一,代理奖励参观新的地方,它具有使新型动的机会较大。第二,代理也奖励参观新的地方,但在一个更加微妙的方式:而第二回忆过去,然后试图通过从预测的过去来预测本一个神经网络学会预测未来状态未来。如果这个预测是错误的它奖励本身,因为它是一个标志,它发现了一些它不知道之前。第二种算法是不能依靠直觉它采取了研究者的时间弄清楚。 

“我们的偏见常常妨碍我们努力很新奇的想法,说:” ALET。 “但是计算机不在乎。他们尝试,看看是什么在起作用,有时我们得到很大的意想不到的结果。”

更多的研究者正在转向机器学习设计出更好的机器学习算法,被称为automl领域。在谷歌,乐和他的同事最近推出了称为自动毫升零一种新的算法发现工具。 (它的名字是定制深网架构对于给定的应用程序对谷歌的automl软件Play和Google deepmind的alpha为零,即可以学习打数以百万计的游戏对自身扮演不同的棋盘游戏程序。) 

通过算法的空间,他们的方法搜索变得简单基本的操作了。但不是寻找一个勘探战略,其目标是发现算法图像分类。这两项研究显示人类使用机器学习方法本身的潜力,创造新的,高性能的机器学习算法。

“我们生成的算法可以被理解和被人理解,但真正了解的代码,我们通过各变量和运作以及它们如何随时间变化不得不原因,”研究的共同作者马丁·施奈德,一名研究生在bt365手机app说。 “这是一个有趣的公开挑战设计算法和工作流程,充分利用计算机的评估大量的算法能力和我们人类的解释和改进对这些想法的能力。” 

从美国的研究得到了支持美国国家科学基金会,科学研究空军办公室,海军研究,本田研究所,淡马锡SUTD实验室,bt365手机app追求智能的办公。


主题: 追求智慧, 人工智能, 算法, 机器学习, 工程学院, 计算的bt365手机app施瓦茨曼, Electrical Engineering & Computer Science (eecs), 计算机科学和人工智能实验室(CSAIL)

回到顶端