图片来源:脸书人工智能研究所
我最近创办了一份专注于人工智能的教育时事通讯,已经有超过 10 万名订户。《序列》是一份无废话(意思是没有炒作,没有新闻等)的 ML 导向时事通讯,需要 5 分钟阅读。目标是让你与机器学习项目、研究论文和概念保持同步。请通过订阅以下内容来尝试一下:
thesequence.substack.com](https://thesequence.substack.com/)
去年,脸书人工智能研究所(FAIR)开源了有史以来最大的开放域聊天机器人 BlenderBot 1.0 。BlenderBot 能够参与几乎任何主题的各种各样的对话,同时表现出类似人类的特征,如同理心和友好的参与程度。BlenderBot 的第一个版本是首批将移情、个性和知识结合在一个系统中的聊天机器人之一。
上周,公平团队 开源了 BlenderBot 的新版本,其中包括对其前身的几项关键改进。更具体地说,BlenderBot 2.0 相对于以前的版本有两项主要创新:
1)提高长期记忆能力。
2)能够上网搜索实时知识。
诸如 GPT-3 或 BERT 之类的转换器架构已经彻底改变了自然语言处理(NLP)系统,但是它们仍然有明显的局限性。其中,长期记忆是大型变压器模型的主要缺点之一。一般来说,变压器架构只能构建高度依赖于预先训练的知识的短期记忆结构。例如,GPT-3 对几年前的电影和电视剧非常了解,但对当前的节目却不了解。
图片来源:脸书人工智能研究所
为了解决这一限制,BlenderBot 2.0 通过触发互联网搜索相关知识的能力来补充培训知识,然后将相关知识保存在其长期记忆库中。在架构上,BlenderBot 2.0 通过一个额外的神经网络来增强其 transformer 模型,该神经网络基于特定的对话上下文触发搜索查询。然后,BlenderBot 将搜索结果与现有的对话知识相结合,以表达最终的响应。
图片来源:脸书人工智能研究所
BlenderBot 2.0 架构的结果是一个聊天机器人,它可以将自然对话与实时知识相结合,同时还可以从以前的对话中访问上下文。BlenderBot 2.0 中使用的技术可以激发新一代对话系统,使转换器架构适应现实世界系统的要求。