登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 经济学类 > 电子商务 > 正文

Web客户留言情感倾向性分析模型--以淘宝客户评价为例毕业论文

 2022-05-26 21:42:39  

论文总字数:18930字

摘 要

随着社会信息化进程的不断深入,电子商务网站的兴起,越来越多的消费者倾向于通过浏览web留言来了解商品的各种属性,从而决策是否购买商品。了解大众对商品的评价也可以帮助商家做出更加准确的决策。

web留言的情感倾向性涉及的研究层面非常广,本文对此研究中涉及的相关技术、相关应用做了详细的介绍。包括情感词典、极性词典、中文情感分类、以及情感分析模型的显示应用,并对这些关键技术的国内外研究现状做了详细的分析研究调查。

web商品留言的情感挖掘目前无法做到准确无误,根本不能让人满意。根据这一问题,本文以淘宝女装顾客评价为例,对电子商务网站现有评价情感挖掘模式进行调研。并通过调查问卷的方式获取商品属性相对应的情感表达词汇。最终形成基于调查问卷的淘宝女装web留言顾客情感表达词汇。

本文最终根据淘宝女装web留言顾客情感倾向性挖掘方式,提出来一种基于调研以及调查问卷的,构造商品属性与情感词汇匹配组合,并将计算得到的褒贬值累加至商品属性的方法,在构造好单一情感倾向性情感词典的基础上与商品属性相结合。这一方法考虑到了电子商务网站商品特殊的情感挖掘需求,以及否定词等对web留言顾客情感倾向性分析的影响。

关键词:web留言 情感倾向性 电子商务 商品属性 模型

Analysis Model of Customer Emotion Tendentiousness on Web Message-Take Couture Customer Reviews on Taobao for an Example

ABSTRACT

With the deepening of the process of social informatization, the rise of e-commerce, more and more consumers tend to leave a message through browsing the web to learn about the various attributes of goods, and make the decision whether to purchase goods. To understand the public opinion of goods can also help businesses make more accurate decisions.

Web message emotion tendentiousness design research level is very wide, this paper studies the design of related technology, introduced the application in detail. Including emotional dictionary, polarity dictionary, Chinese emotion classifications, the traditional method of emotion tendentiousness and sentiment analysis model of the application, and make a detailed researches on the key technology research status at home and abroad introduced.

At present, Web goods introduced can't accurate message emotional mining, not be satisfactory. According to this problem, based on the taobao couture customer evaluation as an example, the model of e-commerce sites evaluation existing emotional mining research. And through the way of questionnaire for commodity attribute corresponding to the emotional vocabulary. Eventually form introduced based on the questionnaire of taobao ladies introduced.

Finally, in this paper, according to the mining way of taobao ladies web message customer emotion tendentiousness, put forward a kind of way that is based on the investigation and questionnaire, commodity attribute and the emotion vocabulary matching combination structure, and will be calculated or depreciation accumulation to commodity attribute, the method of single emotion tendentiousness in constructing good emotional dictionary on the basis of combined with commodity attribute. This method took into account in the e-commerce sites goods special emotional needs, as well as negative effects on web message customer emotional tendency analysis.

Key words: web message; emotion tendentiousness; the electronic commerce; commodity attribute; model

目录

摘要 1

ABSTRACT 2

第一章 绪论 6

1.1选题背景 6

1.2研究路径和方法 6

第二章 文献综述 8

2.1web留言顾客情感倾向性的起源 8

2.2国内外web留言顾客情感倾向性的研究现状 8

2.2.1情感分析的相关应用 9

2.2.2 情感分类 9

2.3淘宝web留言体系现有模式 10

第三章 购物网站女装网上评价调研 12

3.1京东商城女装web留言情况 12

3.2苏宁易购女装web留言情况 12

3.3天猫女装web留言情况 13

3.4淘宝女装已有顾客评价调研结果 13

第四章 淘宝女装web顾客留言问卷调查与分析 15

4.1淘宝女装web顾客留言习惯的调查问卷 15

4.1.1 web顾客留言习惯的调查问卷的目的 15

4.2调查问卷显示结果 15

第五章 淘宝女装web留言顾客情感分析模型 22

5.1基于调查问卷的情感分析表达词句 22

5.2改进淘宝web留言情感挖掘体系的方案 22

5.2.1商品属性抽取 22

5.2.2商品属性和情感词匹配 23

结语 24

附录 28

致谢 31

第一章 绪论

1.1选题背景

跟随着网络的高速成长,网络应用范围的扩大,已经有越来越多的用户把互联网看成是重要的社会交际工具,网络已经成为人们生活中不可或缺的一部分。人们在旅游、外宿、用餐之前常常会通过各种方式了解相关信息。在早期这种信息的传播大多数依赖人与人的口口相传。随着互联网的出现,相当一部分信息来源于网络。

随着电子商务的发展,电子商务网站如雨后春笋般涌出,电子商务已经成为相当重要的零售业态。近年来,在线客户评论已经成为电子商务领域的研究热点。与企业发布的信息相比,客户更愿意通过阅读在线客户评论从消费者的角度了解产品和服务的真实信息并得到其他消费者的购买建议。带有明显情绪色彩的评述所带给的作用远远大于中性评论,而且带有负面情感的影响又远大于正面评论所带来的影响。于商家而言评论可以了解自己的商品在大众严重的形象如何,从而引导商品销售方向,改进不足发挥优势,顾客评价对生产决策、销售方式具有一定的知道意义。对于消费者来说,可以更好地对商品的相关属性进行评价,可以让消费者更加充分的了解商品信息,结合自己的真实需求决策是否购买。但不同的顾客往往使用不同的语言文字进行顾客评价,且大量有效、真实的信息被无效信息掩埋、分散。所以准确的判断web留言顾客情感倾向性分析具有非常重要的商业价值。

基于上述的发展状况和技术需求,如何有效的抽取web留言中的有效信息资源,为网络消费者提供更多有效的商品信息已经成为国内外学者研究关注的重点。电子商务网站顾客留言信息进行检索以及推荐服务的研究具有重要的研究意义以及研究价值。本文选择了web留言顾客评价情感倾向性分析作为研究内容。

1.2研究路径和方法

首先搜集web留言、情感分类、数据挖掘等有关本课题的相关研究资料,其次通过调研等手段研究淘宝现有web留言体系,并根据调研获得的信息设计调查问卷,发布问卷并获得有效调查问卷后,分析调查问卷成果,归纳总结基于调查问卷的不同评价方式从而提出web留言识别模式的新观点。

本研究以淘宝女装顾客留言为例。由淘宝女装web留言入手。采用调研的方式对不同

电子商务网站女装顾客评价进行调研,从而获取商品属性以及顾客可能的留言中的情感词汇。根据调研对淘宝女装不同性别、不同年龄层的顾客进行调查问卷,由此获得淘宝女装顾客普遍性的留言褒贬义情感表达。根据调研以及调查问卷显示结果,对淘宝女装顾客web留言系统提出更好的改进方案。

第二章 文献综述

2.1web留言顾客情感倾向性的起源

近年来,电子商务成了一个非常重要的零售业态。随着电子商务网站的兴起,越来越多的消费者倾向于通过浏览顾客留言来了解商品的实物、口碑等重要参数,从而决策是否购买商品。同时web留言也可以帮助生产商、销售商了解商品的市场消费者体验。从而更好地改良商品以及销售模式。从而增加自身商品的有效竞争力。但是现在web留言的数量迅速增长,顾客留言的内容越来越复杂、形式多样。Web留言中的有效信息就越来越难以获取。 所以有效获取web留言中的有效信息迫在眉睫。在英文web留言体系中,研究者已获得了初步的研究成果,而在中文web留言体系中,由于语言系统的不同、文化体系的不同。英文web留言成果暂不能应用于中文web留言体系。

2.2国内外web留言顾客情感倾向性的研究现状

中文web留言侧重于抽取评价词和目标对象之间的关联关系。这种关联关系包括直接关系和间接关系两种。直接关系例如在例句“产品A的价钱很低廉”。其中低廉为价钱的直接评价对象。而产品A为低廉的间接评价对象。根据国内外的相关研究现状可知,web留言大多呈现词语、短句形式的描述。而词语级别的顾客情感情感倾向性研究比较薄弱。词语情感倾向性研究一般是通过语义词典[1]或同义词林来直接得出词语的倾向性,然后再通过短语、句子中的某些关键词的情感分析从而判断短语、句子的整体大意。对于以词语倾向性分析为重点的研究少之又少。 传统的词语倾向性分析有两种方法,一种是基于词频统计来计算词语的倾向性概率。这种方法需要很多大规模语料,如何选择语境以及情感倾向关键词也非常困难。所以这种方法不但复杂而且很难得到理想的结果。另一种方法就是基于语义词典得到词语的倾向性。该方法简单易行,但是不能从词典中得到词语倾向性程度,即默认词典倾向性程度大小不同的词语对语句或篇章的情感倾向性贡献相同,无法挑选出语句中的重点情感分析词汇。如此可知,在多情感词的句子片段中,情感的综合判断会出现误差甚至无法判断准确。同时,词典只能提供词语本身的倾向性,而没有结合语境来分析,虽然有的词典给出词语的一些属性,但是这也不能覆盖词语的语境信息。国外Hunetter等人受手工建立了一个基于情感类别的极性词典[2]。词典中包含了语句中词语的情感表达力度。同时标注了词语的向心力。计算出符合规则的词语情感倾值。通过与平均值的比较确定情感的倾向性。

2.2.1情感分析的相关应用

1.推荐系统

推荐系统是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。而浏览过多的产品信息会使实际有效的信息被海量信息掩盖。为了解决这些问题个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务为其顾客购物提供完全个性化的决策支持和信息服务。

2.过滤系统

主要应用于政府或商业网站不良信息的过滤。自动识别发文者的政治倾向或对商业机构的不良评价。根据留言文本中的情感进行分类,对不利于政府或商业网站的信息进行过滤。

3.问答系统

问答系统能用准确、简洁的自然语言回答用户用自然语言提出的问题问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。国际上许多大的科研院所和著名公司,都积极参与到该领域的研究,中文问答系统需要在现有的中文信息技术处理基础上,充分研究和利用问答的特性与需求,通过各种方法解决和克服(或暂时回避)以上难点和困难,设计和开发问答系统。

2.2.2 情感分类

 截至目前,心理学中对情感分类还没有准确的划分标准。根据不同的标准情感被分为3、4、6、8、10甚至20多种,主要原因是由于人的情感复杂多变,现代人类对情感的认知不够全面,但情感划分的研究还在不断的研究和发展中,目前情感的分类主要有一下几类:

3类:支持、中立、反对

6类:高兴、悲伤、愤怒、恐惧、厌恶、惊奇

7类:中国的传统“7情”主要分为:好、恶、乐、怒、哀、惧、欲

12类:高兴、悲哀、恐惧、愤怒、厌恶、惊奇、喜爱、期待、焦虑、内疚、赞扬、羞

所以综上所述,随着网络时代的快速发展,电子商务已经成为人们生活中不可或缺的一部分。购买后的顾客留言也已经成为顾客表达自我观点、商家改良自身商品的重要平台。因此web留言中的顾客情感倾向性数据挖掘[3]也受到学术界的普遍关注。国外的相关研究比较深入,并且取得了一系列阶段性的进展。而中国的web留言顾客情感倾向性分析的研究还暂时处于起步发展阶段。再加上汉语言文字自身丰富多彩、一个词语多重含义的特点,web留言顾客情感倾向性分析主要集中于留言中词汇、短语的褒贬义分析。因此挖掘评价对象的倾向性类别更加具有现实意义。构建一部高效、完善、准确的专用于顾客评价体系的极性词典也是亟待解决的。

2.3淘宝web留言体系现有模式

淘宝作为目前国内最大的电子商务零售网站每日成交量非常之大,所有的顾客在商品购买流程结束之后,就可以通过淘宝提供的商品评价体系对所购买的商品进行评价。于是产品就产生了大量的评价内容。然而顾客留言评价关系到制造商对商品的改良、销售商对商品销售模式的改进。以及顾客对商品做出准确的判断。目前淘宝的评价体系知识简单的讲顾客的评价罗列与商品的下方。这些评价包括商品的品质、颜色、大小、质地、物流、服务等很多的相关信息。如果想要单独查看关于产品的某种特有的性质评价就比较困难。如果商品购买量较少,人工逐条翻阅也是一种合适的途径获取有效信息。如果商品购买量大,顾客留言评价多则人工逐条翻阅耗时且无法准确获取留言中的准确信息。淘宝中的统计性评价“好评、中评、差评”也是由顾客人工手动评定。有时顾客对商品的某些方面并不满意,甚至非常不喜欢,但是因为某些原因选择了好评。有时顾客对商品非常满意但仍然选择了差评。这些都会对有效信息的获取产生巨大的影响。目前淘宝使用的文本倾向性研究是通过计算词汇褒贬倾向性,累加得到文本褒贬倾向性。基于机器学习的文本倾向性判断,主要方式是通过手工标记一些文档,将它们作为机器训练集,通过机器学习[4]利用SVM[5]等分类器对顾客评价进行分类,从而得到顾客评价的情感倾向。这种方式由于中文评价的特殊性容易出现判断失误等一系列问题。如下图所示顾客评价“如果有合适的再来”,淘宝现有的顾客情感倾向性挖掘方式就将之直接判定成为“大小合适”,然而通过人工判定,顾客想要表达的是“会再次购买”,与顾客想要表达的情感并不相符。

图2-1 淘宝顾客情感挖掘失误页面截图[6]

请支付后下载全文,论文总字数:18930字

您需要先支付 50元 才能查看全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图