Google为人工智能助手提供了对人类水平的理解的开源数据集

人工智能2020-07-24 18:31:31
导读Google今天开放了两个人之间对话数据集的指导式会话偏好征集(CCPE)和Taskmaster-1开源。Go

Google今天开放了两个人之间对话数据集的指导式会话偏好征集(CCPE)和Taskmaster-1开源。Google AI研究人员正在共享这两个数据集,以提供为实现人类水平性能的自然语言系统建模所需的培训材料。

Google研究人员称CCPE是一种收集语音数据的新方法。它包括与人们进行500场关于他们的电影喜好的对话-总共10,000场,涉及12,000项讲话。

电影首选项之所以被选为主题,是因为元数据的价值,例如演员和导演的姓名。

“我们没有将工人限制在详细的脚本或很小的知识库上,因此,与现有数据集相比,我们观察到我们的数据集包含更加现实和多样化的对话,”一篇涉及CCPE的论文发表。

Taskmaster-1数据集由13,200多个对话样本组成。它和CCPE都是使用“绿野仙踪”方法制作的,其中一个人扮演代理的角色,临时工作人员网站上的工作人员描绘的是普通的数字助理用户。

Taskmaster-1包含六个类别的对话:订购比萨饼,创建汽车维修约会,设置乘车服务,订购电影票,订购咖啡饮料以及进行餐厅预订。

在其他Google对话式AI的其他新闻中,Google的Project Euphonia引入了对话式AI,以提高对带有重音和ALS的人的声音的识别,并且Google DeepMind研究人员与其他AI社区利益相关者合作,推出了SuperGLUE基准以实现更健壮的对话式AI。

免责声明:本文由用户上传,如有侵权请联系删除!