Facebook的ReAgent是用于强化学习和推理AI的工具包

互联网2020-08-04 06:30:46
导读 Facebook AI Research今天推出了ReAgent,这是一种增强型学习工具包,用于构建可以接收

Facebook AI Research今天推出了ReAgent,这是一种增强型学习工具包,用于构建可以接收反馈的决策AI。ReAgent可以将分数分配给用户操作,并将用户输入(例如单击推荐内容)作为训练数据。

ReAgent是一个小型C ++库,可以在GitHub上下载,该库旨在嵌入任何应用程序中。该工具包随附一组入门的决策AI模型,一个用于模型性能评估的离线模块,以及一个使用PyTorch中的TorchScript库将AI部署到生产中的平台。

Horizo​​n是强化学习平台,用于在Facebook于2018年11月开源的生产中部署大型模型,现已成为ReAgent的一部分。

应用研究负责人Srinivas Narayanan今天在Facebook的@Scale会议上说,ReAgent目前每天用于在Facebook上个性化数十亿个决定,例如针对Facebook和Instagram的用户通知。它也用于机器人技术研究中,以教机器如何走路。

Facebook在博客中说:“它是用于创建基于AI的推理系统的最全面,模块化的开源平台,并且是第一个包含策略评估的策略,该策略结合了离线反馈以改进模型。” “通过简化实时,大规模决策模型的构建,ReAgent使研究项目以及生产应用中策略的创建和评估民主化。

为了继续改进ReAgent,Facebook发布了有关如何部署到Microsoft Azure等云服务的文档。微软的Azure认知服务于今年初推出了自己的强化学习服务。

该消息是在Facebook的PyTorch开发者大会之后一周发布的,该公司在该大会上介绍了Captum,这是一种用于解释机器学习的工具。

在今年夏天VentureBeat的Transform会议上的一次对话中,OpenAI首席技术官Greg Brockman和首席科学家Ilya Sutskever认为,推理和可解释性应该是未来AI模型的核心。

免责声明:本文由用户上传,如有侵权请联系删除!