AI对话系统中的博弈问题研究开题报告
2020-02-20 10:22:06
1. 研究目的与意义(文献综述)
1.1 课题来源
本课题联系当前nlp领域热门的对话系统领域问题,旨在研究博弈现象在对话系统中的应用和实现。
1.2 研究目的及意义
1.2.1 研究目的
针对当前目的导向型对话系统中,在博弈情境中的应用问题,设计基于supervised learning和reinforcement learning的博弈对话系统,研究在博弈情境中的对话系统运行机制,实现一个高效的博弈型对话系统。
2. 研究的基本内容与方案
2.1 研究内容
本文主要实现一种能够进行高效博弈的对话系统,从而在买卖场景中提供更优的解决方案。通过对研究现状的分析,本系统拟采用端到端的方式,利用强化学习来训练状态跟踪器及策略学习,从而优化系统的鲁棒性。具体的内容包括以下几个部分:
(1)对话数据采集
数据采集对于机器学习的模型训练是一个非常重要的环节,主要有以下几种方式:
3. 研究计划与安排
(1)2019/1/14—2019/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2019/2/29—2019/4/30:对话系统架构设计与开发、系统测试与完善;
(3)2019/5/1—2019/5/25:撰写及修改毕业论文;
4. 参考文献(12篇以上)
[1] hongshen cheny, xiaorui liuz, dawei yiny, and jiliang tangz. 2017.a survey on dialogue systems: recent advances and new frontiers. acm sigkddexplorations newsletter
[2] m. lewis, d. yarats, y. n. dauphin, d. parikh, and d. batra.2017. deal or no deal? end-to-end learning for negotiation dialogues. inempirical methods in natural language processing (emnlp)
[3] h he, d chen, a balakrishnan, p liang. 2018. decoupling strategyand generation in negotiation dialogues. arxiv:1808.09637