基于UGC文本挖掘的新零售线下门店顾客满意度计算与分析研究 ——以盒马鲜生为例开题报告
2020-04-29 20:07:24
1. 研究目的与意义(文献综述包含参考文献)
一、 选题背景与意义
目前,电子商务在经历了一段迅猛发展的时期后,开始面临线上用户增速放缓,流量红利逐渐消失的问题。此外,由于我国人均消费水平的提高,居民消费升级,越来越多的消费者开始注重消费时的过程及体验。因此,传统的线上消费”瓶颈”使得”新零售”开始进入人们的视野。”新零售”推动了线上线下和物流相结合,运用大数据、云计算等新技术为线上线下消费者提供全方位的消费服务。
”盒马鲜生”是”阿里巴巴”投资的”新零售”项目,其业务由线上app和线下门店两部分构成。线下门店主要是对生鲜商品进行标准化的售卖,线上app则主打门店附近3公里范围内,30分钟内送货上门。”盒马鲜生”线下门店会开展互动活动,从而吸引消费者、丰富消费场景和提升消费体验,以达到”线下为线上引流”,提高销量的目的。
2. 研究的基本内容、问题解决措施及方案
自马云在2016年下半年提出了”新零售”的概念后,阿里巴巴便通过”盒马鲜生”进行全新的零售模式的试水。本论文通过文本挖掘技术对”大众点评”上消费者对”盒马鲜生”的评论提取影响顾客满意度的影响因素,并针对性地为”盒马鲜生”提出建议,有助于”新零售”企业根据自身具体情况作出改善。
首先,通过python爬取第三方评论网#8212;#8212;”大众点评”上的”盒马鲜生”消费者评论。运用python语言的jieba库对评论文本进行分词处理,通过参数stop_words来引入一个数组作为停用词表,对分词结果进行去停用词的处理。对评论进行中文分词、去除停用词后,运用jieba.posseg词性标注库对所有的分词进行词性的标注,运用python的counter库进行词频统计,选择出现频率高的词作为特征词。通过python中的wordcloud制作词云。通过词云图展示顾客提及的频率最高的关注点。
其次,结合tf-idf和word2vec,进行词向量化以及特征词的提取,利用k-means聚类算法,对tf-idf和word2vec进行特征词聚类分析,对比分析两种方法的准确性,聚类的结果便是”盒马鲜生”顾客满意度影响因素。