Facebook的ReAgent是用于强化学习和推理AI的工具包

2020-08-04 06:30:46 来源：用户：

Facebook AI Research今天推出了ReAgent，这是一种增强型学习工具包，用于构建可以接收反馈的决策AI。ReAgent可以将分数分配给用户操作，并将用户输入(例如单击推荐内容)作为训练数据。

ReAgent是一个小型C ++库，可以在GitHub上下载，该库旨在嵌入任何应用程序中。该工具包随附一组入门的决策AI模型，一个用于模型性能评估的离线模块，以及一个使用PyTorch中的TorchScript库将AI部署到生产中的平台。

Horizon是强化学习平台，用于在Facebook于2018年11月开源的生产中部署大型模型，现已成为ReAgent的一部分。

应用研究负责人Srinivas Narayanan今天在Facebook的@Scale会议上说，ReAgent目前每天用于在Facebook上个性化数十亿个决定，例如针对Facebook和Instagram的用户通知。它也用于机器人技术研究中，以教机器如何走路。

Facebook在博客中说：“它是用于创建基于AI的推理系统的最全面，模块化的开源平台，并且是第一个包含策略评估的策略，该策略结合了离线反馈以改进模型。” “通过简化实时，大规模决策模型的构建，ReAgent使研究项目以及生产应用中策略的创建和评估民主化。

为了继续改进ReAgent，Facebook发布了有关如何部署到Microsoft Azure等云服务的文档。微软的Azure认知服务于今年初推出了自己的强化学习服务。

该消息是在Facebook的PyTorch开发者大会之后一周发布的，该公司在该大会上介绍了Captum，这是一种用于解释机器学习的工具。

在今年夏天VentureBeat的Transform会议上的一次对话中，OpenAI首席技术官Greg Brockman和首席科学家Ilya Sutskever认为，推理和可解释性应该是未来AI模型的核心。

标签： Facebook

　　免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！