登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 经济学类 > 电子商务 > 正文

基于电商评论情感分析的商品评价毕业论文

 2021-10-19 22:37:22  

摘 要

随着网络购物越来越流行,网络商品评价也逐渐变成衡量商品好坏的重要参考,但现如今快速积累的评价不利于消费者快速提取商品信息,且评价中存在“高分差评”、“低分好评”等现象,也不利于消费者的决策判断。因此,对电商评论做出情感分析,从而对整体商品评价进行校正是有意义的。

本文主要研究了基于电商评论的情感分析和商品评价,通过对文本评价的情感分析和商品的综合打分,在消除矛盾性评价对消费者带来不利影响的同时,也为消费者提供更准确的商品评价。

首先是将文本评价通过情感分析,转化为文本评分。情感分析主要有三类方法:机器学习、语料包及两者的混合模式,本文基于双向长短期记忆(BiLSTM)模型对商品文本评价进行情感分析。首先爬取京东商城原始商品评论,将文本评论清洗后,经过中文分词和Word2Vec的词向量处理,得到情感分析模型的输入。BiLSTM在一般循环神经网络的基础上,既避免了梯度影响,又结合了上下文进行预测。此外,设置了LR和SVM两组对照组,结果表明BiLSTM在处理情感分类效果更好, F1值达到了92.5%。

其次是将文本评分和数值评分进行综合分析,得到商品的综合评分。先将基于BiLSTM模型得出来的文本评分和原始数据中的数值评分做消费者怀疑度分析,即方差分析。再将两者误差作为评分定权依据为9类评价分别定权,最终得出商品的综合评分,结果表明经调整过权重后的商品综合评分更符合消费者的客观期望。

本文还可以通过训练大量评价语料,做出一个专门分析电商评价的情感分析系统,将应用推广到各个电商平台。同时,文本评价的情感分析还可以推广到其他领域,如网络舆论监控、评论异常检测等。

关键词:商品评价;情感分析;文本分类;BiLSTM模型;深度学习

Abstract

With the growing popularity of online shopping, consumers have considered online reviews as key information to measure the quality of items. However, the fast accumulation of long reviews deprives consumers of understanding the main concept of those reviews, and contradictory reviews also affect their decision-making. Therefore, it is important to extract major information of commodity reviews.

This paper mainly studies sentiment analysis and commodity evaluation based on comments from e-commerce platform, including sentiment analysis of text reviews and comprehensive commodity scoring two parts. The negative impact of contradictory comments can be eliminated and more precise evaluation can be provided through this paper.

Firstly, the text comments are translated into text score through sentiment analysis based on BiLSTM model. The source of product review is Jingdong mall, after cleaning the text review, processing with word segmentation tool and Word2Vec to get word vector matrix. BiLSTM is a bidirectional LSTM, compared with the general Recurrent Neural Networks, and it not only eliminates the effect of gradient explosion or gradient disappearance, but also combines the context for prediction. In addition, two control groups, LR and SVM, are set up, and the results show that BiLSTM is better at processing text classification, with F1 value reaching 92.5%.

Secondly, the text score and the rating score are comprehensively analyzed to obtain the comprehensive score of the goods. After the analysis of variance between text score and rating score, the degree of consumer scepticism for each category of review is also analyzed. Then, the error is used as the basis for determining the weight of the score. The result shows that after adjusting the weight, the comprehensive score of the goods is more consistent with the objective expectation of consumers.

This paper is helpful to make a special sentiment analysis system to analyze e-commerce comment. At the same time, the sentiment analysis of text evaluation can also be applied to network public opinion monitoring and comment anomaly detection.

Key Words: Commodity Evaluation; Sentiment Analysis; Text Classification; BiLSTM Model; Deep Learning

目 录

第1章 绪论 1

1.1 选题背景和意义 1

1.2 国内外研究动态 1

1.2.1 基于情感词典分析的研究现状 2

1.2.2 基于机器学习情感分析的研究现状 2

1.2.3 基于混合方式情感分析的研究现状 3

1.3 研究内容与方法 4

1.3.1 研究内容 4

1.3.2 研究方法 4

第2章 相关基础理论评述 6

2.1 文本的表示模型 6

2.1.1 One-hot词袋模型 6

2.1.2 Word2Vec词嵌入模型 7

2.1.3 GloVe词共现矩阵模型 8

2.2 深度学习 8

2.2.1 卷积神经网络 9

2.2.2 循环神经网络 9

2.2.3 递归神经网络 10

第3章 基于深度学习的情感分析 12

3.1 问题描述和分析 12

3.2 数据采集和预处理 12

3.3 基于BiLSTM模型的情感分析 13

3.3.1 LSTM的原理和缺陷 13

3.3.2 BiLSTM模型的建立 14

3.4 文本评分实验及结果分析 15

3.4.1实验评价指标 15

3.4.2实验结果及对比分析 16

第4章 基于文本评论和数字评分的商品综合评价 18

4.1 基于方差的评分定权 18

4.1.1 基于方差的消费者怀疑度分析 18

4.1.2 基于误差的评分定权 18

4.2 商品综合评价 19

第5章 结论与展望 21

5.1 研究结论 21

5.2 未来展望 21

参考文献 23

致 谢 24

第1章 绪论

1.1 选题背景和意义

在现如今电子商务的快速发展下,网络购物的体系也逐渐健全,越来越多的人更倾向于网购。但由于网购产品的信息不对称性,人们不仅依靠商家自身对产品的介绍,更依靠购买过产品的顾客对商品的评价。但现有的评论机制有两个局限性,其一,快速累积的评价通常让顾客难以在短时间内提取关键信息,如在大多数京东商城的数码畅销品评论都超过一万,这给顾客的判断和购买决策都提供了一定的障碍。其二,现有电商平台都是采用数值评分和文本评论的方式,好评率只是取了数值评分的平均值,忽略了如“高分差评”矛盾性评价导致评分的可参考性降低。为解决这两个问题,首先要对评论做文本挖掘,再结合数值评分,对商品做出相对真实的评价。

为评论做文本挖掘通常会用到情感分析,用来识别并提取商品评价中的主观信息。通常情况下,由于存在短句评论,句子级和篇章级的情感分析不足以体现精细情感分析,因此,词语级的文本挖掘变成重点。精细情感分析(Fine-grain Sentiment Analysis Survey)是基于对象的情感分析,也是词语级的情感分析,对象情感词(Sentiment Word)也称观点对象词,通常由形容词、副词、动词和名词组成,可以使用基于词典、网络和语料库的分析方法对这些词语进行提取。例如一条手机评价,“屏幕音效、拍照效果都还蛮不错的,就是信号不太好,有时候运行速度还是有点慢”,这里的商品特征对象就是指“屏幕音效”、“拍照效果”、“信号”、“运行速度”,观点对象包括“蛮不错”、“不太好”、“有点慢”。

您需要先支付 50元 才能查看全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图