基于数据挖掘方法的购物篮分析及决策开题报告
2021-12-29 21:51:58
全文总字数:3439字
1. 研究目的与意义及国内外研究现状
随着信息技术的不断发展,大数据时代应运而生,数据代表这竞争,象征着财富。在新的时代,面对激增的信息与数据,为了获得庞杂的数据背后隐藏的真正有用的信息,获得更多的利益,数据挖掘技术逐渐成为各行各业商家瞩目的焦点。数据挖掘是一个利用各种方法,从海量数据中提取隐含和潜在的对决策者有用的信息和模式的过程,随着数据挖掘方法与技术的不断成熟,数据挖掘已普遍应用于商业、社会、经济、教育、金融、医学等领域。早期的数据挖掘是面对结构化数据的挖掘,随着数据挖掘技术的广泛应用,数据挖掘的技术更为高端。总的来说,数据挖掘有两个方向:一是总结过去的海量数据,发现规律;二是面对未来信息,做预测性分析。
在美国沃尔玛超市里有这样一个有趣的现象:啤酒和尿布摆在一起出售。这种奇怪的举措不但没使这两种商品购买力下降,反而获得了更多的销量。原来沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,啤酒与尿布两件看上去毫无关系的商品会经常出现在同一个购物篮中。原来,在美国年轻的父亲前去超市购买尿布的同时,往往会顺便为自己购买啤酒。因此沃尔玛开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物。同时沃尔玛超市也可以让这些客户一次购买两件商品,而不是一件,从而获得了更多的销售收入。这个案例向我们揭示了商品之间是具有关联关系的,如果我们发现并利用这些商品之间的关联关系,就可以在无法大幅增加门店客户数的前提下,通过增加购物篮中的商品数量达到增加销售额的目的,从而获得更大的经营收益。
本文通过对超市购物篮数据的研究,得出商品之间的内在关联,研究成果具有重要的理论意义和实际应用价值。理论上,研究购物篮营销模式的规律,对于拓展零售业战略理论具有重要的学术价值;从实际应用的角度,本研究的成果能够利用这些商品之间的关联关系,可以在无法大幅增加门店客户数的前提下,通过增加购物篮中的商品数量达到增加销售额的目的,从而获得更大的经营收益。
2. 研究的基本内容
本文面向日益发展繁荣的零售业,借助数据挖掘技术,有效利用业务系统积累的海量数据,借助传统统计分析工具,挖掘商品之间的关联信息。本文采用CSDN网站提供的Market Basket数据集,是某大型超市在一段时间内的1000名顾客的一次购物记录,包括1000个样本,17个变量。论文内容安排如下:1、对该数据集做一个简单的统计分析,通过SPSS软件对数据做相关分析、聚类分析、因子分析,对各种商品的关联性做一个初步判别;2、通过Clementine软件运用Apriori、GRI算法对数据做关联规则的挖掘,并对得到的关联规则运用C5.0算法做决策树分析,得到关联规则的规则置信度和支持度等其他测度指标;3、对数据集的个人信息部分进行分类,在此基础上,对不同类别下的商品信息做进一步的关联规则挖掘,得出关联性;4、对几种统计方法得到的结果进行对比分析,进行总结和分析,得到最后商品之间的关联结果,对客户的购买行为规律进行总结。5、根据最终得到的购买行为规律进行评价和拓展,并实际运用到超市营销战略中,以期获得更好的效益。
3. 实施方案、进度安排及预期效果
1、本文实施方案如下:
第一部分首先对论文的研究背景及意义进行了概述,然后概括了近年来国内外对该选题的研究现状,最后对本文的创新点进行了阐述。
第二部分介绍了本文研究所用的方法的理论基础,主要包括相关性分析、聚类分析、因子分析、关联规则、决策树分析。
4. 参考文献
[1]薛薇,陈欢歌.基于clementine的数据挖掘[m].北京:中国人民大学出版社,2012:435-455.
[2]何晓群,刘文卿.应用回归分析(第三版)[m].北京:中国人民大学出版社,2011.
[3]梁婧婕,曹婷.数据挖掘在超市大数据中的应用[j].商场现代化,2016,7:10-13.