淘宝用户评论分析毕业论文
2020-04-23 20:16:56
摘 要
首先,在当今这个信息化时代,随着互联网技术的发展,计算机和智能手机的使用群体越来越庞大,人们的衣食住行各种信息都存在于互联网之中,互联网已经逐渐和我们的生活融合,成为我们生活的一部分,网络购物也日渐繁荣,成为了最受大众欢迎的购物方式之一。
其次,在如今信息科学高速发展的今天,大量数据分布于互联网,大量数据未充分利用,互联网里隐藏了不可估量价值的数据,如果将如此庞大的数据提取出来,并进行进一步的分析,挖掘更深层次的信息,其价值是不可估量的。淘宝用户评论作为大数据的一份子,对其进行挖掘分析既可以方便买家更加高效地做出购物选择,又能帮助卖家进行口碑营销,实现淘宝买家与卖家的双赢。充分挖掘分析淘宝用户评论就是本文的主要工作。
本文以only店铺为例,通过对该店铺的用户评论数据采集,对采集到的数据进行情感倾向分析,给买家提供购物选择的建议,同时分析出买家对某类商品的喜好。
关键词:淘宝评论 数据采集 网络爬虫 文本挖掘 情感分析
Taobao user reviews data collection and data value analysis
——Taking only store as an example
ABSTRACT
First of all, in today's information age, with the development of Internet technology, the use of computers and smart phones is becoming more and more large. People can use the Internet for their daily activities and information acquisition. The Internet has become submerged in our lives. In part, online shopping is booming and it is also becoming increasingly in vogue.
Secondly, in today's rapid development of information science, massive data is presented on the Internet, however, it has not been fully tapped and has not made full use of all the data. The Internet hides the data of immeasurable value. When you extract so much data, do further analysis and extract deeper information, its value is not measurable. Level of information, its value is immeasurable. As a part of big data, Taobao user comments can not only facilitate buyers to make shopping choices more efficiently, but also help sellers to promote word-of-mouth marketing and achieve a win-win situation for Taobao buyers and sellers. Fully mining and analyzing Taobao user reviews is the main work of this article.
This article takes the only store as an example, through the user's comment data collection of the store, analyzes the sentiment tendency of the collected data, provides buyers with suggestions for shopping choices, and analyzes the buyer's preference for certain types of products.
Keywords: Taobao comment; data collection; web crawler; text mining; sentiment analysis
目 录
摘要 I
ABSTRACT II
目 录 III
第一章 绪论 1
1.1 选题背景 1
1.1.1网络购物发展的现状 1
1.1.2网络购物的优势 2
1.1.3淘宝评论分析的必要性 3
1.2 研究目的及意义 4
1.3 研究内容与研究方法 4
1.3.1研究内容 4
1.3.2研究方法与研究结构 4
第二章 文献综述 6
2.1淘宝评论研究现状 6
2.2网络爬虫研究现状 7
2.3文本挖掘研究现状 9
2.4文本情感分析研究现状 10
第三章 淘宝用户评论数据采集 11
3.1爬虫功能需求分析 11
3.2爬虫采集相关数据流程 11
3.3爬虫优化 16
3.4数据抓取结果 20
第四章 数据处理 22
4.1数据预处理 22
4.2数据处理过程的缺点 31
4.3数据处理结果 32
第五章 数据分析 33
5.1运用TF-IDF算法抽取淘宝评论关键词并运用词云进行可视化 33
5.2淘宝用户评论数据情感分析 37
5.3针对服装类商品的淘宝消费者喜好分析 42
第六章 结束语 43
6.1结论 43
6.2不足与展望 43
参考文献 45
致谢 48
- 绪论
- 选题背景
1.1.1网络购物发展的现状
随着互联网与人们生活的日渐融合以及互联网使用面积的扩大,在当今社会,网络已经成为人群中不可缺少的一种工具,没有网络,人们的生活将寸步难行,而电子商务也成功地吸引了很大一部分使用互联网的人群,网络购物随之也成为了人群更受欢迎的一种购物方式。
本节通过对第43次《中国互联网络发展状况统计报告》[1]中的相关数据进行整理来获得表1-1,如下表所示。从表1-1当中,我们可以直观地看到2017年-2018年在中国使用网络的人数变化,以及使用手机进行互联网活动的比例变化,最后,统计出我国2018年底网络购物的人数及比例变化,从该表中我们可以明显看出随着我国网络普及率以及手机上网比例的提高,我国公民进行网络购物的规模也有了显著提升。
表1-1 我国2017年-2018年互联网普及情况及使用方式变化-网购规模变化
年份 | 我国互联网使用人数 | 网络普及率 |
2017年 | 7.72亿 | 55.8% |
2018年 | 8.29亿 | 59.6% |
年份 | 使用台式电脑上网的中国公民比例 | 使用手机上网的中国公民比例 |
2017年 | 43.0% | 93.6% |
2018年 | 48.0% | 98.6% |
2018年底我国网络购物用户人数 | 相较于2017年的年增长率 | 网民使用率 |
6.10亿 | 14.4% | 73.6% |
然后本节又整理了2012年-2018年网络购物及使用手机进行网络购物的用户人数及对应比例,更加直观地展示了网络的普及对网络购物发展的重要影响。
相关图片展示: