Google发布了强化学习的开源框架

金融2020-03-23 15:36:55
导读 谷歌已经发布了一个基于TensorFlow(一种机器学习库)的强化学习(RL)开源框架。Google Brain团队开发了具有灵活性,稳定性和可重复性的框架

谷歌已经发布了一个基于TensorFlow(一种机器学习库)的强化学习(RL)开源框架。

Google Brain团队开发了具有灵活性,稳定性和可重复性的框架。

强化学习 - 机器学习的一个分支,其中计算机程序学会采取行动以最大化某种结果或奖励 - 近来已经走过了漫长的道路。

这类人工智能的最着名的工作实例来自 伦敦大学学院的初创公司 DeepMind,谷歌在2014年初以4亿英镑的价格收购了该公司。

DeepMind的RL项目包括 DQN,一个能够掌握一系列Atari 2600游戏的程序,以及最近成功的 AlphaGo, AlphaGo Zero和 Open AI Five 系统 - 所有这些系统都能够玩超出专家能力的游戏 -水平人类。

建立强化学习系统的挑战

开发RL系统通常需要研究人员快速迭代设计,有时会破坏已建立的框架,没有明显的路径可以找到解决方案。

谷歌研究人员帕布罗·塞缪尔·卡斯特罗(Pablo Samuel Castro)和马克·贝勒马尔(Marc Bellemare )在本周发表的Google AI 博客中写道,他 指出这种方法的缺陷会如何减缓开发过程并限制探索。

他们写道:“大多数现有的RL框架都没有提供灵活性和稳定性的结合,使研究人员能够有效地迭代RL方法,从而探索可能没有直接明显益处的新研究方向。”

“此外,从现有框架中复制结果往往过于耗时,这可能导致科学的可重复性问题。”

Google提供的软件包旨在提供易用性,反映可重复性重要性的工具,以及一系列培训数据,这些数据将使新研究人员能够根据既定方法迅速对他们的想法进行基准测试。

免责声明:本文由用户上传,如有侵权请联系删除!