AI对话系统中的博弈问题研究文献综述

2020-04-15 17:05:37

1．目的及意义

1.1 课题来源

本课题联系当前NLP领域热门的对话系统领域问题，旨在研究博弈现象在对话系统中的应用和实现。

1.2 研究目的及意义

1.2.1 研究目的

针对当前目的导向型对话系统中，在博弈情境中的应用问题，设计基于Supervised Learning和Reinforcement Learning的博弈对话系统，研究在博弈情境中的对话系统运行机制，实现一个高效的博弈型对话系统。

1.2.2 研究意义

近年来，随着深度学习和自然语言处理领域的不断探索，对话系统的研究和应用也越来越广泛。博弈问题在当前电商炙手可热的时期，也是广受大家的关注。而在对话系统中进行博弈问题的讨论仍然处于一个起步阶段，仍有很多问题亟待我们解决。

通过研究博弈问题在对话系统中的应用，可有效提高在需要进行博弈的场景中双方的谈判效率；通过在对话系统中研究博弈问题，可以促进对话系统的进一步发展；通过将复杂的博弈问题引入到对话系统中，有利于对话系统训练的新模式的探索。

该研究针对当前博弈问题在对话系统中的应用亟需研究，但是相关的研究仍然十分不成熟的现状，构建基于Supervised Learning和Reinforcement Learning的博弈对话系统，设计一个端到端的博弈对话框架，对博弈问题在对话系统中的研究具有重要意义。

1.3 国内外的研究现状

1.3.1 对话系统的研究现状

近年来，对话系统无论是在学术领域还是应用领域上，都得到了广泛的关注。同时，由于深度学习在计算机视觉，自然语言处理和推荐系统等领域，都取得了不错的成果，因此将深度学习引入对话领域也是近年的一大趋势。通过利用大量对话数据，结合深度学习的对话系统可以学习到更有意义的特征表示和对话策略，后者同时也引入了一些手动设置的规则来提高对话效率。对话系统按照功能不同可以分成两种：任务指向型和非任务指向型。^[1]其中，任务指向型的对话系统可以协助使用者完成特定的功能（如找商品，订酒店等），一般由而非任务指向型就是我们通常所说的聊天机器人，如苹果公司的Siri,微软公司的Cortana等。任务指向型对话系统的实现方法有两种：管道方法（PipelineMethods）和端到端方法（End-to-EndMethods）。管道方法是将整个对话流程分为四个部分：自然语言理解（NLU），对话状态跟踪（DST），对话策略学习（Dialogue policy learning）,自然语言生成（NLG）。其中，自然语言理解模块是将用户的输入解析为预定义的语义槽，通过意图检测(intent detection)和插槽填充(slot filling)两个过程，将输入的句子转化为格式化的内容，进而送入对话管理部分进行处理。对话管理部分由对话状态跟踪和对话策略学习两部分，前者是使得系统可靠的关键模块，它能够估计每一轮对话中使用者的目标。策略学习模块用于以对话跟踪器中的当前状态为基础，生成对应的下一步动作，这一模块可以通过监督学习和强化学习进行优化。最后通过自然语言生成模块可以将对应的动作转换成自然语言进行输出。

剩余内容已隐藏，您需要先支付 5元才能查看该篇文章全部内容！立即支付

注册

找回密码