登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 计算机类 > 计算机科学与技术 > 正文

面向蚂蚁金服的问题相似度计算文献综述

 2020-04-15 09:36:21  

1.目的及意义

1.1目的

以TechFin为基础的普惠金融,一个重要目标就是给广大用户提供高效和个性化的客户服务体验。以人工智能技术为核心的智能客服在提升用户体验方面扮演了重要角色。人工智能技术帮助客服人员提供更加高效的服务,在某些场合下甚至能直接向用户提供准确和个性化的客户服务。在经济和技术发展日新月异的今天,客服以其普惠的商业价值和研究价值吸引了大量的专家学者,在学术界得到了广泛的研究。

智能客服的本质,就是充分理解用户的意图,在知识体系中精准地找到与之相匹配的内容,回答用户问题或提供解决方案。问题相似度计算,是贯穿智能客服离线、在线和运营等几乎所有环节最核心的技术,同时也是自然语言理解中最核心的问题之一,广泛应用于搜索、推荐、对话等领域。在问题相似度计算上的突破,能够促进整个NLP领域的蓬勃发展,推动通用人工智能的大跨步前进,给人类社会带来巨大的经济价值。

1.2 意义

探讨这一自然语言处理领域的基础问题,能推动智能客服乃至整个人工智能技术的发展,使机器能理解用户的金融诉求,使得更多人能够享受到更加高效、便捷、优质体验的普惠金融服务。语句相似度计算不仅是NLP领域的研究方向,也是智能客服系统的重要关键技术,更是研究之重。提高问题相似度匹配的正确率是保证智能客服系统的前提,所以,提高问题相似度匹配的准确率有着非常重要的意义,与此同时,问题相似度计算作为智能客服系统的重要核心技术推动着智能客服系统技术的发展。因此,在智能客服系统中研究问题相似度计算有着极度重要的实际意义。

1.3 国内外研究现状

问题相似度是用来判断不同问题表述之间的相似程度的参数。问题相似度计算作为智能客服系统的技术核心尽管取得了一些进展,但是依然一些错误情况,当用户输入问题时往往找不到正确答案。特别是中文的智能客服系统,由于汉语的复杂性使得语义理解和句法分析等方面的进展相当缓慢,有些智能客服系统分析用户输入语句时只考虑了语句中最表面的信息,没有对语句进行更多的挖掘,使其真正的语义信息展露出来,使得返回的答案不精准。所以研究语句之间的关系,计算问题之间的相似度就变得十分重要。

国外的研究学者在对词语相似度进行深刻研究后,提出了不少相比之前算法更加成熟的计算方法:基于构建字符的相似度计算方法、基于词典注释的计算方法,基于WordNet的计算方法,基于向量空间模型的计算方法,基于语料库训练的计算方法。针对英文语句的元素:Goldsdein等人提出的利用最大边缘相关法计算; Chris H.Q.Ding. 等人提出的采取语句隐含语义索引目标的方法: Nirenburg提出的基于字符串匹配的计算方法,采用词组合法的相似衡量机制,相似度采用计分制,两个语句匹配得到的总分是由语句中单个词语匹配分数组成的;针对长短不-的语句相似度计算,Lambros 等人提出了语句语义内容与语句结构相结合的方式,借助两级动态规划技术,它能够解决长短不一语句的相似度计算问题。还有大多数研究方法集中采用的是对字符串的相似度研究: LSC算法、基于编辑距离及相似串的模糊匹配、MCWPA字符块快速匹配比较算法等。

问题相似计算作为智能客服系统的关键技术,国内对语句的相似度算法的探究也有很多,很多学者提出了自己的算法或是改进算法:有基于词序词性等表层特征的相似度计算方法、基于语义信息的相似度计算方法、基于句法结构信息的相似度计算方法等等。

基于词序词性等表层特征的相似度计算方法结合了向量距离模型进行综合运算。该方法以词序、词频、词性突出语句中某个或某几个词语的作用,然后用这些词语来表征特定语句。主要方法就是将语句中的词语集合与专家库中的词语集合相比较,计算两个语句中相同的词语集合和词序得到两个语句的关系,同时利用向量空间模型将两者的相似部分作为一“个参数向量参与到后续计算当中。

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图