技术控

    今日:0| 主题:63445
收藏本版 (1)
最新软件应用技术尽在掌握

[其他] DeepMind论文:结合生成式对抗网络和Actor-Critic方法

[复制链接]
原来完美并不美 发表于 2016-10-8 13:11:30
280 3

DeepMind论文:结合生成式对抗网络和Actor-Critic方法

DeepMind论文:结合生成式对抗网络和Actor-Critic方法

   摘要:

   无监督学习中的生成式对抗网络和强化学习中的 actor-critic 方法都是出了名的难以优化。两个领域的实践者都积累了大量的策略缓和这些不稳定性,并改进训练。在此论文中,我们表示 GAN 可被视为在 actor 不能影响 reward 的环境中的 actor-critic 方法。我们通过为每一类模型进行稳定训练来检阅这一策略,无论是一般的模型还是特定的模型。我们也使用更复杂的信息流检查了一些对 GAN 和 RL 算法的拓展模型。我们期望通过重视这类连接,能够鼓励 GAN 和 RL 研究社区开发出更泛型、更可扩展的、更稳定的算法,从而对神经网络进行多层的优化,也期望我们的方法能给各个社区以启发。
    论文地址:  Connecting Generative Adversarial Networks and Actor-Critic Methods  
       声明:本文由机器之心编译出品,原文来自arXiv.org,作者:David Pfau、Oriol Vinyals,,机器之心对于违规侵权者保有法律追诉权。
   
       
  • 网站转载请在文章开头粗体注明:本文转载自机器之心,标明作者,并附上本文链接。   
  • 微信公众号转载请在开头粗体注明:本文转载自机器之心,标明作者,并设置阅读原文链接为本文链接,微博转载请附上本文链接并@机器之心synced。   
  • 网站和微信转载具体文章后需来信至邮箱[email protected]说明,备注转载文章标题、转载的微信号名称和转载日期。   
  • 机器之心只接受如上几种转载方式,其余均视为侵权,如需商业合作请致信[email protected]。   
回复

使用道具 举报

22335589 发表于 2016-10-24 09:24:24
2016-10-24是个特别的日子,值得纪念!
回复 支持 反对

使用道具 举报

李孟秋 发表于 2016-11-16 15:49:58
我承认我是因为标题才进来的
回复 支持 反对

使用道具 举报

崩坏学园 发表于 2016-11-17 11:01:02
不回帖,臣妾做不到啊!
回复 支持 反对

使用道具 举报

我要投稿

推荐阅读


回页顶回复上一篇下一篇回列表
手机版/c.CoLaBug.com ( 粤ICP备05003221号 | 粤公网安备 44010402000842号 )

© 2001-2017 Comsenz Inc.

返回顶部 返回列表