研究

神经规划的参数化层次程序

作者:Roy Fox, Richard Shin, Sanjay Krishnan, Ken Goldberg, Dawn Song, Ion Stoica

下载论文

摘要

神经程序是高度精确和结构化的策略,通过控制计算机制的行为来执行算法任务。尽管有可能增加人工代理行为的可解释性和组合性,但从代表计算机程序的演示神经网络中学习仍然很困难。将算法领域与其他模仿学习领域区分开来的主要挑战是对高精度的需求,数据的特定结构的涉及,以及极其有限的可观察性。为了解决这些挑战,我们建议将程序建模为参数化分层过程(PHPs)。PHP是一个条件操作序列,使用程序计数器和观察来选择执行基本操作、作为子过程调用另一个PHP和返回调用方。我们从一组监督演示中开发了一种训练php的算法,其中只有部分演示带有内部调用结构的注释,并将其应用于多级php的高效分层训练。我们在NanoCraft和long-hand addition两个基准中展示了php可以从少量带注释和未带注释的演示中更准确地学习神经程序。

相关内容

作者:Andrew Chen, Andy Chow, Aaron Davidson, Arjun DCunha, Ali Ghodsi, Sue Ann Hong, Andy Konwinski, Clemens Mewald, Siddharth Murching, Tomas Nykodym, Paul Ogilvie, Mani Parkhe, Avesh Singh, Fen Xie, Matei Zaharia, Richard Zang, Juntai郑俊泰,Corey Zumar, Databricks, Inc.

作者:Matei Zaharia, Andrew Chen, Aaron Davidson, Ali Ghodsi, Sue Ann Hong, Andy Konwinski, Siddharth Murching, Tomas Nykodym, Paul Ogilvie, Mani Parkhe, Fen Xie, Corey Zumar, Databricks Inc.

作者:Philipp Moritz, Robert Nishihara, Stephanie Wang, Alexey Tumanov, Richard Liaw, Eric Liang, Melih Elibol, Yang Zongheng, William Paul, Michael I. Jordan和Ion Stoica, UC Berkeley

作者:Firas Abuzaid, Joseph Bradley, Feynman Liang, Andrew Feng, Lee Yang, Matei Zaharia, Ameet Talwalkar

作者:Cody Coleman, Deepak Narayanan, Daniel Kang,赵田,张健,Luigi Nardi, Peter Bailis, Kunle Olukotun, Chris Ré, Matei Zaharia

作者:Daniel Crankshaw, Wang Xin, Giulio Zhou, Michael J. Franklin, Joseph E. Gonzalez, Ion Stoica

作者:Reza Bosagh Zadeh,向瑞孟,Alexander Ulanov, Burak Yavuz, Li Pu, Shivaram Venkataraman, Evan Sparks, Aaron staples, Matei Zaharia

作者:祥瑞孟,约瑟夫·布拉德利,Burak Yavuz, Evan Sparks, Shivaram Venkataraman, Davies Liu, Jeremy Freeman, DB Tsai, Manish Amde, Sean Owen, Doris Xin, Reynold Xin, Michael J. Franklin, Reza Zadeh, Matei Zaharia, Ameet Talwalkar

作者:Eric Liang, Richard Liaw, Philipp Moritz, Robert Nishihara, Roy Fox, Ken Goldberg, Joseph E. Gonzalez, Michael I. Jordan, Ion Stoica