上周我们发布了《攻略 | 虽然票早已被抢光,你可以从机器之心关注 NIPS 2017》,在 NIPS 2017 正式开始前,我们将选出数篇优质论文,邀请论文作者来做线上分享,聊聊理论、技术和研究方法。 所以,第一期分享来了。
北京时间 11 月 8 日 20:00 至 21:00,多伦多大学在读三年级博士生 Yuhuai Wu(吴宇怀)将为大家分享一篇 NIPS 2017 论文《Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation》。
分享者简介
Yuhuai Wu(吴宇怀),多伦多大学在读三年级博士生,师从 Roger Grosse。曾在 Geoffrey Hinton、Yoshua Bengio、Ruslan Salakhutdinov 等指导下做研究。主要研究方向是优化算法、强化学习。是 2017 年 Google fellowship in machine learning 的得主之一。2017 暑假于 OpenAI 做实习,开源了 ACKTR 算法。
演讲主题
这次演讲主要研讨一个最近研发的似自然梯度的优化算法 -- KFAC(似二阶算法)。我们将其用在强化学习的问题上,并提出了新的强化学习算法 -- ACKTR,发现比前人的算法有效 2-3 倍。
针对这篇论文,机器之心曾发布过一篇简介:《OpenAI 开源算法 ACKTR 与 A2C:把可扩展的自然梯度应用到强化学习》,请大家做课前预习。
参与方式
线上分享将在「NIPS 2017 机器之心官方学霸群」中进行。加群方式:长按扫描下方二维码,添加「机器之心小助手Ⅱ」,备注暗号:147,由小助手拉大家入群。
机器之心 NIPS 2017 专题策划:http://ift.tt/2AlxsIx
]]> 原文: http://ift.tt/2j39mOJ | | 机器知心 | | |
没有评论:
发表评论