基于深度时空网络的购物预测及推荐系统文献综述
2020-04-14 22:16:31
1.1 研究目的及意义
时针跳到2018年11月12日0时,2018年双十一结束,留下的是让人目瞪口呆的数据。2018年双十一当天,淘宝全网销售额高达3143.2亿元人民币,打破了2017年2539.7亿的记录,同比增长23.8%。这一惊人的数据表示,当今社会,随着互联网和移动应用的发展,网上购物已经成为了一种新的购物理念,越来越多的人选择从网上选购他们需要的商品,足不出户便可以达到购物目的,节省了大量的时间。为了迎合市场需要,越来越多的网上商城也应运而生。国外知名的网上商城有PayPal、amazon等,国内著名的有阿里巴巴旗下的淘宝网、京东商城、苏宁易购等。由于网上商城24小时服务、商品种类繁多选择性大、快递方便送货上门、售后保障也越做越好再加上也比较经济实惠的优点,网上商城已经有超赶现实商城的趋势,假以时日,随着技术的发展和普及,网上商城取代现实商城将不再是空谈。
但是面对日趋激烈纷繁复杂的网络市场竞争,只有拥有了网站自己的核心竞争力,自己的网站特色,才能留住老消费者,吸引新的消费者,有品牌创新力,才会在日益激烈的电商大战中使自己之立于不败之地。因此,提高用户对网站的忠诚度、优化商务网站设计、提高购买率,成为商家所要考虑的重中之重。然而,不同于传统的购物环境,在没有面对面交流媒介的网络中,由于消费者的购物导向不确定,在众多商品里很容易迷失方向,所以提高消费者购物意向是必须考虑的问题。如果能预测出消费者最希望购买的商品就能大大提高购买率,为了解决这一问题,本系统基于深度时空网络对消费者网上购物意向预测分析,即根据历史购物数据,通过在过去时间内消费者的浏览历史路径预测消费者的购买意愿,将预测得到的最大可能性购买的商品中对消费者进行提示,从而使消费者网上购物的稳定性和效率得以提高,提高消费者网上购物欲。这样有助于大大满足消费者的购物需求,达到他们的购物目的,也可以为商家打出广告,介绍产品,扩大销路,达到一举两得的目的。
1.2国内外的研究现状
国内外比较知名的购物网站如淘宝网,亚马逊也有这样的功能,“猜你喜欢”就是通过你的浏览记录给你推荐你可能会感兴趣的商品。根据亚马逊申请的专利,以及亚马逊发布的一个行业报告,亚马逊用的是基于物品的协同过滤。在纯协作系统中,基于用户社区的兴趣向用户推荐项目,而不对项目内容进行任何分析。协作系统通常通过让用户对热门项目列表中的各个项目进行评级来进行操作。通过该过程,每个用户构建评级数据的个人简档。为了为特定用户生成推荐,最初将用户的简档与其他用户的简档进行比较,以识别一个或多个“类似用户”。这些类似用户评价很高的项目然后建议用户。协同过滤的一个重要好处是它克服了上述基于内容的过滤的缺陷。
2. 研究的基本内容与方案
{title} 2.1 研究内容
随着移动网络的发展,人们丰富的移动轨迹信息得以被记录,准确地预测人们下一步的行为事件和所到地点,有着重要的商业价值。所以基于用户的历史购物数据,结合深度学习模型开展研究,一方面对用户喜好、可能的浏览点击、行为轨迹实现尽可能准确的预测;另一方面,通过预测用户未来的行为做出相应的推荐。
马尔科夫模型已经被广泛用于时序预测,它要基于不同因素之间很强的独立性假设,不能处理事件之间的时间间隔问题,而时间间隔信息对于预测行为的准确性很重要。递归神经网络已经被成功运用于词嵌入问题和时序点击预测问题并展现出了很好的性能,但传统的时间感知递归神经网络中每一层的输入只能包括一个元素,不能很好地对连续时间内的事件进行建模。本系统根据一种基于时间感知递归神经网络的事件预测方法,首先将事件发生时间的历史记录划分成有固定长度的时间区间,并将时间区间划分为更短的时间间隔,将每个时间区间中所有时间间隔内在某地点发生的事件的隐含向量表示作为时间感知递归神经网络每一层的输入,以地点的隐含向量表示与事件的隐含向量表示的内积作为对于此事件是否会在此地点发生的预测。其结合利用时间感知递归神经网络获取的周期性背景信息和在每个时间区间内的短期背景信息对将要发生的事件进行预测,提高预测的准确性。该模型不仅有效地将商品购买记录的时序特征和用户的一般购物兴趣特征融为一体,即模型能够从商品特征和商品间的局部全局时序特征中学习到用户的动态购物兴趣,然后基于这些重要特征给出合理的商品推荐。其中物品的种类和品牌是要重要考虑的,这两个特征能对用户的购买意向起到决定性的作用,最后的推荐列表将会重取决与这两个因素,基于用户最常浏览物品下的最常点击品牌,根据其他用户选择意向数据生成商品的推荐序列,给予最优的结果贴近用户达到推荐系统的目的。
2.2 研究目标
2.2.1在编程方面,主要实现以下功能:用户数据采集和导入、用户行为数据分析、商品推荐。完成系统的编码与调试。
2.2.2在论文写作方面,主要完成以下任务目标:
(1)查阅15篇相关文献(不少于3篇外文文献),并每篇书写200—300字文献摘要(装订成册,带封面);
(2)认真填写周记,完成至少1500字开题报告(“设计的目的及意义”至少800汉字;“基本内容和技术方案”至少400汉字;
(3)完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);
(4)完成10000字以上的毕业论文;
2.2.3进行论文答辩。
2.3 技术方案及措施
整个系统分为四层,分别为:
数据层:数据层负责储存各种信息及数据,主要是一些数据文档。
支撑层:支撑层提供了关键的支撑系统,包括规范接口等规范支撑系统。
应用层:应用层主要提供数据转换、分析、处理、导出、消息通知,训练模型等服务。
接口层:根据训练的模型预测用户可能购买的商品并返回推荐列表。
具体功能方案:
用户数据采集和导入,导入包含用户购买信息的文档,并对数据进行处理,根据4C原则清洗数据:Correcting, Completing,Creating, and Converting。
用户行为数据分析,根据导入的用户信息建立用户画像,用户画像是根据用户特征(性别、年纪等)、消费行为记录等信息进行抽象化,建立标签化的用户模型。
特征提取,通过大量试验提取有效特征,生成用户数据。
商品推荐,使用TensorFlow建立动态周期神经网络模型,训练模型并改进使其达到预测目标并将训练得到的模型持久化。
预测,运用持久化的模型对用户数据进行预测,得到推荐序列。
整个系统基于ubantu系统开发。Linux系统通过在Windows系统安装虚拟机实现。
[1]Zheng, Yu. Methodologies forCross-Domain Data Fusion: An Overview[J]. IEEE Transactions on Big Data, 2015,1(1):1-1.
[2]Zhang J , Zheng Y , Qi D , et al.DNN-based prediction model for spatio-temporal data[C]// Acm SigspatialInternational Conference on Advances in Geographic Information Systems. ACM,2016.
[3]Zhang J , Zheng Y , Qi D . DeepSpatio-Temporal Residual Networks for Citywide Crowd Flows Prediction[J]. 2016.
[4]Zhang J , Zheng Y , Qi D , et al.Predicting Citywide Crowd Flows Using Deep Spatio-Temporal ResidualNetworks[J]. Artificial Intelligence, 2018:S0004370218300973.
[5]Wu C Y , Ahmed A , Kumar G R , et al.[ACM Press the 26th International Conference - Perth, Australia(2017.04.03-2017.04.07)] Proceedings of the 26th International Conference onWorld Wide Web, - WWW "17 - Predicting Latent Structured Intents fromShopping Queries[C]// International Conference. 2017:1133-1141.
[6]Liu Q , Feng Yu#8727;, Wu S , et al. A Convolutional Click Prediction Model[C]// the 24thACM International. ACM, 2015.