李飞飞团队最新研究：神经任务编程NTP，让机器人具有强大泛化能力_最新动态

您所在的位置：程序员俱乐部 > 新闻资讯 > 最新动态 > 李飞飞团队最新研究：神经任务编程NTP，让机器人具有强大泛化能力

李飞飞团队最新研究：神经任务编程NTP，让机器人具有强大泛化能力

2017/10/13 11:26:11 程序员俱乐部我要评论(0)

摘要：9月26日，在温哥华举行的IROS大会上，计算机视觉专家、斯坦福AILab&VisionLab主任李飞飞做了“AQuestforVisualIntelligence”的演讲，这也是李飞飞首次参加IROS这一机器人为主题的大会。值得注意的是，近日雷锋网(公众号：雷锋网)在Arxiv发现了一篇讲述新型机器人学习框架的论文《NeuralTaskProgramming:LearningtoGeneralizeAcrossHierarchicalTasks》
标签：团队能力编程机器人研究

class="topic_img" alt=""/>

　　9 月 26 日，在温哥华举行的 IROS 大会上，计算机视觉专家、斯坦福 AI Lab&Vision Lab 主任李飞飞做了“A Quest for Visual Intelligence”的演讲，这也是李飞飞首次参加 IROS 这一机器人为主题的大会。值得注意的是，近日雷锋网(公众号：雷锋网)在 Arxiv 发现了一篇讲述新型机器人学习框架的论文《Neural Task Programming: Learning to Generalize Across Hierarchical Tasks》，该论文的主要作者来自于斯坦福，其指导教师正是李飞飞及其丈夫 Silvio Savarese。这也标志着人工智能和机器人两个社区在视觉与感知方面的重合度越来越大，之后的合作也会越来越紧密。

　　下面雷锋网和大家来一起看这篇论文。

李飞飞团队最新跨界<a href= 研究：神经任务编程 NTP，让机器人具有强大泛化能力" />

　　摘要：在本论文中，我们提出了一种名为神经任务编程（NTP）的新型机器人学习框架，该方法可以通过较少的示范和神经程序引导进行学习。NTP 可将输入的规范性任务（例如任务的视频演示）递归地将其分解成更精细的子任务规范，这些规范被传递到分级神经程序，通过可调用的底层子程序是与环境进行交互。同时，我们在三个机器人操纵任务中验证了我们的方法，在试验中，NTP 展示了在显示分层结构和组合结构的顺序任务的强泛化能力化。实验结果表明，NTP 在学习长度不定、可变拓扑和不断变化的未知任务的学习和拓展有较好的效果。

　　背景

　　自越来越强调“人机协作”的今天，机器人通常在某些特定环境中与人进行长时间的交互，如物体分类、装配、和清理等。但是以往的机器人通常需要在固定的场景下才能与人交互，如何让机器人能适应复杂的操作任务、新的任务目标和周围环境，则是机器人技术中的一个重大挑战。

　　设想一个仓库中的物体分类任务，这通常包括分类、检索、打包等具体任务，每个任务又可以分解为若干个动作，如抓取、移动、放下等，这些动作构成了如抓取和放置等子任务，如果在考虑到不同的对象、排序、子任务的排列组合，当中的变化将会非常复杂，例如，将四类物品分类放到四个容器中，这当中的组合会有 256 中之多。本文中，我们希望解决复杂任务规划的两个主要挑战，即a）从新的概念化到新的任务目标的学习策略，以及b）与长期环境交互的基本原生代码模块的组合。

　　神经任务编程（NTP）原理

　　NTP 的关键基本思想在是跨任务学习和与共享域中的可重用表示。NTP 对一个描述任务过程和最终目标时间序列的任务规范进行解释，并将其分层策略实例转化为一个神经程序。NTP 从输入规范中解码生成任务目标，并将其分解为子任务并与周边环境进行交互和反馈直至搭成目标，每个程序调用环境观察和任务规范（输入），并输出下一个子程序和相应的子任务规范。