首页 科技 > 正文

苹果研究人员开发了一个人工智能框架 通过使用用户的意图自动标记数据

苹果的Siri等个人助理通过自然语言命令完成任务。然而,它们的基本组件通常依赖于有监督的机器学习算法,这需要大量人工标注训练数据。为了减少收集数据的时间和精力,苹果研究人员开发了一个框架,通过使用用户参与信号来自动创建数据增强标签。他们报告说,当与多任务学习和外部知识库验证等策略融合时,带注释的数据将大大提高生产深度学习系统的准确性。

研究人员在预印本中写道:“我们认为,这是首次使用用户参与信号来帮助大规模生成序列标记任务的训练数据,它可以应用于实际设置中,以很少的手动注释数据来加快新功能的部署。”“另外.用户参与信号可以帮助我们通过从自己的错误中学习来确定数字助理需要改进的地方。”

研究人员使用了一系列启发式方法来识别表明主动参与或被动参与的行为。其中一些功能包括轻敲内容以进一步参与(正面响应)、长时间听一首歌(另一个正面响应)或中断智能助手提供的内容并手动选择其他内容(负面响应)。这些信号以一种“保护隐私的方式”被有选择地收集,以自动生成基本事实注释,然后它们与人类注释者提供的粗粒度标签相结合。

为了将粗粒度标签和推断的细粒度标签结合到AI模型中,本文的共同作者设计了一个多任务学习框架,将粗粒度和细粒度实体标签视为两个任务。此外,他们合并了一个由实体及其关系组成的外部知识库验证器。给定“something”作为音乐标题,将“The Beatles”作为音乐艺术家,查询查询“The Beatles played by The Beatles”,验证器将找到顶部标签备选,并将它们发送到一个组件,该组件将对预测进行排序,并返回最佳选择。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。