电子商务平台真实评价的还原方法毕业论文
2021-11-01 22:14:30
摘 要
在网络购物的过程中,虽然大部分的消费者并没有过不愉快的购物经历,但是对于少部分的消费者而言,有些不愉快的购物体验可能会对他们一天能的心情,乃至一段时间的生活质量都造成严重的影响。经过各种形式的调查,消费者不满意的主要原因是因为商品本身的质量与商家宣传的质量不符。这是因为,相对于传统的市场购物,电子商务市场更容易出现信息不对称性,商家更容易隐瞒商品的缺点,从而导致消费者的权益受到损害。因此,用户在购买商品之后发表的评价可以提供参考信息给那些潜在的消费者,也可以从侧面监督商家与电子商务平台。然而这些评价也可能被商家利用,从而出现不真实的评价,而这些评价会对消费者造成误导,因此将这些虚假的评论识别出来就是一件极其重要的保护消费者利益的行为。
为了遏制这些可能出现的不诚信行为,本文通过对京东购物平台进行整体结构的分析,从而实现对我们所需要的数据,即商品的评论进行爬取和预处理,再从经过预处理之后的数据中选择评论文本的显示特征,建立独有的线性回归模型来识别虚假评论,最后利用消费者的隐含情感来验证这个回归模型,从而给消费者,商家,购物平台一个真实的反馈与建议。本文的研究结果在一定程度上还原了电子商务平台的真实评价,并为虚假评论识别的发展提供了一个新的方向,同时也为后续更深层次的研究隐含情感对评价的影响提供了一个坚实的基础。
关键词:虚假评论;显示特征;隐含情感;线性回归;真实评价
Abstract
In the process of online shopping, although most consumers don't have unpleasant shopping experience, for a small number of consumers, some unpleasant shopping experience may have a serious impact on their mood and even the quality of life for a period of time. After various forms of investigation, the main reason for consumers' dissatisfaction is that the quality of the goods themselves is not consistent with the quality of the publicity of the businessmen. This is because, compared with the traditional market shopping, e-commerce market is more prone to information asymmetry, merchants are more likely to conceal the shortcomings of goods, which leads to the damage of consumers' rights and interests. Therefore, the evaluation published by users after purchasing goods can provide reference information to those potential consumers, and can also supervise businesses and e-commerce platforms from the side. However, these evaluations may also be used by businesses, resulting in untrue evaluation, which will mislead consumers, so identifying these false comments is an extremely important behavior to protect the profit of consumers.
In order to curb these possible dishonest behaviors, this paper analyzes the overall structure of Jingdong shopping platform, so as to realize the crawling and preprocessing of the data we need, that is, the reviews of commodities, then select the display features of comment text from the preprocessed data, and establish a unique linear regression model to identify false comments, and finally uses consumers In order to give consumers, businesses and shopping platforms a real feedback and suggestions. The research results of this paper restore the true evaluation of e-commerce platform to a certain extent, and provide a new direction for the development of false comment recognition. At the same time, it also provides a solid foundation for further research on the impact of implicit emotion on evaluation.
Key Words:False comment;Display features;Implied emotion;linear regression;True evaluation
目录
摘 要 I
第1章 绪论 2
1.1本研究的目的和意义 2
1.2虚假评论识别的国内外发展研究现状 2
1.2.1基于评论类别的虚假评论识别 2
1.2.2基于不同方法的虚假评论识别 3
1.2.3基于特征对象的虚假评论识别 4
1.3真实评价还原的的研究内容与组织结构 4
1.3.1真实评价还原的研究内容 4
1.3.2真实评价还原的组织结构 5
第2章 京东评论的获取与预处理 6
2.1京东评论的获取 6
2.1.1爬虫方法及其爬取深度 6
2.1.2爬取京东评论的具体步骤 7
2.2评论文本数据的预处理过程 10
第3章 虚假评论的特征比较与选择 12
3.1特征选取 12
3.1.1购买时间与发表评论时间之间的差 12
3.1.3点赞数与回复数 13
3.1.4情绪判断和情感词占比 13
3.2标注训练数据 15
第4章 虚假评论的识别与真实评价的还原 16
4.1回归模型的数据分析 16
4.2回归模型的参数检验 16
4.3回归模型的结果分析 17
4.4由可视化的数据反映真实评价的还原 18
第5章 总结与展望 21
5.1总结 21
5.2展望 21
参考文献 22
致谢 23
第1章 绪论
1.1本研究的目的和意义
随着我国电商的高速发展,用户信息被泄露、网络诈骗、企业之间出现无序竞争等问题暴露出来[1]。网上购物的弊端也逐步显现 ,淘宝交易过程中的信用问题更是尤为突出,并严重侵害了消费者的合法权益,其中网络消费者容易受到侵害的权利集中于:知情权、监督权[2]。印证这一点的事实是,在网络购物的过程中,仍有接近20%的用户曾经有过不愉快的购物经历[3]。由于网络的虚拟性和开放性以及买卖双方的不对称性,诚信成为了制约电子商务发展的瓶颈,大部分电子商务平台都采取信用评价体系来解决这一问题,但是效果却不尽如人意[4]。
根据已有的一些学者的研究基础,本文通过进行一系列实际的调查与对这些研究基础的总结,将消费者购买商品之后书写的评论中的主要构成因素提取成显示的特征,并将这些显示特征整合成一个评价体系,然后创造了一个还原真实评价的方法,为我国电商的健康有序发展奠定基础。为了更直观的表达这个过程,本文通过对我国著名的电子商务平台——京东里的一件具体商品(苹果手机)的评价的研究和分析,运用本文创建的新的真实评价的还原方法,来对评价进行一个直观的分析。虽然只是一个个例,但是见微知著,可以对我国电子商务网站发展过程中存在的问题进行一个总结,从而对未来的电子商务的发展提供一个良性的影响。并且在这个过程中,我们需要找出其最深层次的问题,对这些问题进行反复的思考与研究,从根本上提供一种新的有用的,能还原出真实评价的方法,从而对目前存在的问题提供一个解决方案。