缺点模板 论文解读:基于动态词表的对话生成研究
编者按:近年来,聊天机器人在飞速发展,很多人也对机器人的对话系统产生了很大兴趣。近期,北京航空航天大学—微软亚洲研究院联合培养博士生吴俣应邀参加了PaperWeekly优质论文线上直播分享活动,带大家回顾了近几年来聊天机器人的发展,对比了检索式和生成式聊天机器人的优缺点,并以第一作者的身份解读了北京航空航天大学和微软亚洲研究院在AAAI2018上发表的有关基于动态词表对话生成研究的论文Neural Response Generation with DynamicVocabularies。一起来看看吧!文章转载自公众号“PaperWeekly”。
浅析对话系统
|论文解读:基于动态词表的对话生成研究" TITLE="干货|论文解读:基于动态词表的对话生成研究" />
对话系统主要分为两类,一类是任务型,另一类是非任务型。任务型对话系统主要应用于企业客服、订票、天气查询等场景,非任务型驱动对话系统则是指以微软小冰为代表的聊天机器人形式。缺点模板
之所以强调这一点,是因为今年我在ACL发表了一篇论文,有同学发邮件问我为什么参考了论文和源代码,还是无法让聊天机器人帮忙订披萨。我只能说,目前聊天机器人实在种类繁多,有的机器人只负责闲聊,有的机器人可以帮你完成某些特定任务。
本次 Talk 会更侧重于介绍闲聊机器人,也就是非任务驱动型对话系统。首先我想给大家推荐一篇关于聊天机器人的综述文章—A Survey on Dialogue Systems: Recent Advances and NewFrontiers。
这篇文章来自京东数据科学团队,是一篇较为全面的对话系统综述,其中引用了 121篇相关论文,并对论文进行了归类。不仅非常适合初学者,也能让大家对聊天机器人领域有一个更为全面的认识。
|论文解读:基于动态词表的对话生成研究" TITLE="干货|论文解读:基于动态词表的对话生成研究" />
面向任务的对话系统主要分为知识库构造、自然语言理解、状态跟踪和策略选择。针对知识库构造,假设我们的使用场景为酒店预订,那首先我们需要构建一些和酒店相关的知识,比如酒店房型、报价以及酒店位置。
具备了这些基础知识之后,接下来就需要展开对话,通过自然语言理解去分辨问题类型(酒店类型、房间类型等)。确认好相关类型后,我们需要借助policy模块,让系统切换到下一个需要向用户确认的信息。更直观地说,我们需要循循善诱引导用户将右表信息填写完整。
聊天机器人类型
|论文解读:基于动态词表的对话生成研究" TITLE="干货|论文解读:基于动态词表的对话生成研究" />
普遍来说,聊天机器人主要分为两类,我认为准确来说应该分为三类。
除了聊天机器人,这种基于模板的文本形成方式还可以应用于很多其他领域,比如自动写稿机器人。
目前比较热门的聊天机器人应该是另外两类,一类是检索型,另一类则是生成型。检索型聊天机器人,主要是指从事先定义好的索引中进行搜索。这需要我们先从互联网上获取一些对话pairs,然后基于这些数据构造一个搜索引擎,再根据文本相似度进行查找。
|论文解读:基于动态词表的对话生成研究" TITLE="干货|论文解读:基于动态词表的对话生成研究" />
|论文解读:基于动态词表的对话生成研究" TITLE="干货|论文解读:基于动态词表的对话生成研究" />
生成模型大多都是基于 Seq2Seq框架进行修改,所谓万变不离其宗,不管大家怎么做,都会是以这个框架为基础。文本生成也是如此,在 RNN 语言模型和Seq2Seq 出来之后,几乎所有生成模型都是基于这个框架。即使把 RNN 换成 CNN 或 Attention is All YouNeed,也仍然离不开这个框架。
丑得我不要不要的作