基于深度学习的智能语音聊天系统的设计与研究文献综述
2020-04-14 17:28:49
随着人工智能的发展,最近几年出现了很多人工智能机器人,在各行各业中都有人工智能的应用,而人工智能的高速发展给我们的生活带来了很大的便利,随着生活质量的提升,人们开始研究用自然语言与计算机的交流,于是智能聊天系统便得到了广大的市场。智能聊天系统通过机器学习,学习自然语言然后来与人类进行对话,它不仅可以回答人类的问题,还可以与人类进行一些简单的对话。
对话系统,也称为交互式会话对象,虚拟代理,有时是聊天机器人,用于从技术支持服务到语言学习工具和娱乐的广泛应用。对话系统可以分为目标驱动系统,如技术支持服务,以及非目标驱动系统,如语言学习工具或计算机游戏角色。而智能对话系统就是无目标驱动系统,这种无目标驱动的对话系统就是开放式领域的智能聊天系统。
其实人工智能的历史已经有了60年,机器人也存在了数十年,但是20世纪90年代以前的聊天系统与用户的谈话仅仅基于谈话技巧和程序技巧,他们都是检索式聊天系统,就是他们的对话库中放着很多对话模板和句型,在当人们问到问题时在对话库中检索匹配的答案。但是这样的聊天系统有很大的缺陷,第一就是需要一个非常大的对话库,因为它在进行对话的时候是根据问题来对话库中找相应的答案,一个需要概括所有问题的对话库是相当庞大的,非常不容易建立。第二就是这样的对话系统缺乏语义分析能力,只是单纯的对问题寻找答案,缺乏对问题的思考,无法对上下文进行思考,就无法得出富有“情商”的回答,对话质量差强人意。因此我们要追求生成式的智能聊天系统,能够根据上下文来理解问题,然后给出富有人类“情商”的回答。
人机交互对很多行业也有很重要的帮助。就像 Facebook Messenger 上的聊天机器人 NBA,它能向用户提供赛事更新、热点和顶级球员信息。但它的交互依赖于预设的指令,而不太能处理自然语言。维多利亚秘密的 VSPINK 机器人,在 Kik 上与该机器人聊天,它会询问关于您现有文胸的问题,帮您选择正确的尺寸。惠普打印机机器人,通过Facebook Messenger窗口,使用者可以通过语言指示惠普打印机器人来打印文档。还有中国建行,客户与机器的交互量能达到每日200万,通过人机交互可以每月节省4000W人民币的电话费,人机交互能够在很大程度上帮助客户能有更好、更人性化、更便捷的服务,而对于各行老板,也能节省许多人工费,是推动人类进步的一个很重要的技术。
随着科学技术的不断发展和市场需求的不断扩大,近年来,自然语音处理、深度学习、语音识别和模式识别等人工智能技术的不断发展,推动智能聊天机器人系统飞速发展。而我们目前最重要的问题就是要继续深入解决机器对上下文的理解,然后进行语义消歧,能给出更好的答复,并且能够有信息理解和知识获取能力,更好的促进人机交互的发展。推动社会向着更加人性化的方向发展。
国外在聊天机器人领域的研究起步比较早,也比较成熟,早在1950年时,著名科学家图灵就发表了《计算机器与智能》,开启了机器智能的时代,随后又不断的有科学家研究并发明新的人工智能,苹果语音助手 Siri、韩国的小黄鸡、IBM 沃森系统、谷歌的 Google Now、微软的 Cortana、亚马逊的 Alexa 等
而相比较之下,国内在这一方面的研究时间较晚,并且面对着两个难难: 第一就是中文与英文不同,在信息处理方面比较麻烦,不能直接应用国外的比较成熟的技术与研究成果,导致研究时间会比较长。第二就是缺少相对应的一些自然语言处理的基础资源,比如语料库、知识库等。
不过最近几年国内公司陆陆续续都推出了各自相应的语音助手,例如小米的小爱语音助手,腾讯的小冰机器人,还有百度的度秘,足以见得我国智能聊天系统的飞速发展。
{title}2. 研究的基本内容与方案
{title}本文研究内容为基于深度学习的智能语音聊天系统的设计,学会通过Google开源的编程系统Tensorflow进行深度学习,来实现一个生成式的智能聊天系统,可以获取主题信息,根据上下文给出更好的回复。
智能语音聊天系统框架分为五个模块,分别为:1、输入预处理模块,2、自然语言理解模块,3、对话管理模块,4、答案生成模块,5、输出处理模块。总流程为: 首先用户输入文字或者语音信息,然后进行预处理,转化成机器语言进行自然语言理解,然后通过上下文进行对话管理,然后对当前对话模型提取答案,最后将生成的回复文本进行合成输出给用户。系统框图如下图(见附件)