Skip to content

Latest commit

 

History

History
41 lines (21 loc) · 3.06 KB

facebook-open-sourced-blenderbot-2-0-fae7848fade1.md

File metadata and controls

41 lines (21 loc) · 3.06 KB

脸书开源混合机器人 2.0,一个可以讨论任何话题的聊天机器人,具有长期记忆,可以在互联网上搜索实时答案

原文:https://pub.towardsai.net/facebook-open-sourced-blenderbot-2-0-fae7848fade1?source=collection_archive---------2-----------------------

新版本扩展了其前身的功能,构建了更加自然的对话体验。

图片来源:脸书人工智能研究所

我最近创办了一份专注于人工智能的教育时事通讯,已经有超过 10 万名订户。《序列》是一份无废话(意思是没有炒作,没有新闻等)的 ML 导向时事通讯,需要 5 分钟阅读。目标是让你与机器学习项目、研究论文和概念保持同步。请通过订阅以下内容来尝试一下:

[## 序列

订阅人工智能世界中最相关的项目和研究论文。受到 85,000 多人的信任…

thesequence.substack.com](https://thesequence.substack.com/)

去年,脸书人工智能研究所(FAIR)开源了有史以来最大的开放域聊天机器人 BlenderBot 1.0 。BlenderBot 能够参与几乎任何主题的各种各样的对话,同时表现出类似人类的特征,如同理心和友好的参与程度。BlenderBot 的第一个版本是首批将移情、个性和知识结合在一个系统中的聊天机器人之一。

上周,公平团队 开源了 BlenderBot 的新版本,其中包括对其前身的几项关键改进。更具体地说,BlenderBot 2.0 相对于以前的版本有两项主要创新:

1)提高长期记忆能力。

2)能够上网搜索实时知识。

诸如 GPT-3 或 BERT 之类的转换器架构已经彻底改变了自然语言处理(NLP)系统,但是它们仍然有明显的局限性。其中,长期记忆是大型变压器模型的主要缺点之一。一般来说,变压器架构只能构建高度依赖于预先训练的知识的短期记忆结构。例如,GPT-3 对几年前的电影和电视剧非常了解,但对当前的节目却不了解。

图片来源:脸书人工智能研究所

为了解决这一限制,BlenderBot 2.0 通过触发互联网搜索相关知识的能力来补充培训知识,然后将相关知识保存在其长期记忆库中。在架构上,BlenderBot 2.0 通过一个额外的神经网络来增强其 transformer 模型,该神经网络基于特定的对话上下文触发搜索查询。然后,BlenderBot 将搜索结果与现有的对话知识相结合,以表达最终的响应。

图片来源:脸书人工智能研究所

BlenderBot 2.0 架构的结果是一个聊天机器人,它可以将自然对话与实时知识相结合,同时还可以从以前的对话中访问上下文。BlenderBot 2.0 中使用的技术可以激发新一代对话系统,使转换器架构适应现实世界系统的要求。