基于用户在线评论的商品改进开题报告
2020-02-11 00:37:13
1. 研究目的与意义(文献综述)
目的及意义
在新的交易方式——电子商务出现后,越来越多的消费者选择网上购买商品和服务,在接纳快速增长的用户的同时,电子商务购物网站保存了消费者大量的行为轨迹,包括用户在购买商品或服务后的评论文本信息。
而对于商家而言,如何更好的改进商品,进而提升用户的消费体验是至关重要的,所以评论信息中隐藏的大量的有价值信息对商家提高商品质量提供有力的数据支持,相较于问卷调查、咨询等传统调研方式,在线评论数据更为庞大直接,消费者的亲身体验使在线评论更具有可信度,在大量的在线评论中找到用户关注的有关商品属性并进行分类分析,可以快速有针对性的改进商品。但正是由于在线评论信息数量庞大,呈现非结构化形式,这些海量且冗余,且夹杂虚假信息,商家如何挖掘有用信息,提取有关商品属性的摘要词,并将有用性强的信息应用于自身商品改进上,将具有重大的意义。
2. 研究的基本内容与方案
本文的研究对象的华为技术有限公司的华为Mate 20 Pro的在线评论信息,目的是分析用户对商品的态度,以此找到产品的优缺点,对商家在产品改进方面提供针对性意见。本文主要运用数据挖掘与分析的方法,对评论句子的情感进行分析并重点提取评论中的否定词以及含否定意义的词。
首先,从京东华为旗舰店华为Mate 20 Pro爬取足够多的消费者评论信息,爬取方法主要是运用八爪鱼等爬虫软件;然后对评论数据进行预处理,预处理主要包括数据清洗,缺失值异常值的处理;第三,对句子评论进行中文分词,本文主要运用基于统计的分词算法,这种算法是在给定大量已经分词的文本的前提下,利用统计机器学习模型学习词语切分的规律,从而实现对未知文本的切分,例如最大概率分词方法和最大熵分词方法,而中文分词主要运用的工具是jieba分词和SnowNLP。第四,对分好的中文分词进行词性标注,因为在我们分析海量评论信息时,只有少部分的名词与形容词是我们需要的,而一些副词与介词的分析价值不大,词性标注在分词时可以同时完成。第五,中文依存句法分析确定句子的结构与句子中词汇之间的依存关系,提取出用户关注的商品特征与对特征的情感态度。第六,根据词性的匹配结果统计大多数人对手机某些特征词的态度,对商家提出针对性的改进意见。
3. 研究计划与安排
第1-4周:收集和整理资料。
第5-6周:拟定提纲,提交开题报告。
第7-13周:撰写论文初稿和修改稿,保持与指导教师的沟通。
4. 参考文献(12篇以上)
[1]赵会芬.电商营销过程中的商品评价体系研究[d].吉林大学,2015.
[2]张璐,吴菲菲,黄鲁成.基于用户网络评论信息的产品创新研究[j].软科学,2015(5):12-16
[3]胡云风.基于主题模型的在线评论分析方法研究[d].西安电子科技大学,2017