登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 物流管理与工程类 > 物流管理 > 正文

跨境电商平台商品转化率方法研究毕业论文

 2020-02-15 23:33:46  

摘 要

近年来,跨境电商行业迎来迅猛发展并已成为主流的贸易方式,由它所驱动的全球化也正在变得越来越普惠。同时,随着跨境电商的不断发展,越来越多的跨境电商平台进入市场。流量是转化的基础,转化是电商企业的利润源泉。对于跨境电商平台的卖家而言,面对更加广阔的消费市场、相对陌生的消费人群,更高要求与多元的消费需求,准确预测商品转化率成为其提高市场竞争力的关键。

本文主要针对用户在跨境电商平台上进行浏览、购买的相关信息进行分析,搭建商品转化率的预测模型。具体工作如下:首先系统地介绍了关于商品转化率方法的相关研究,并对典型算法进行论述。其次通过分析影响跨境电商平台商品转化率的相关因素,综合应用逻辑回归(Logistic Regression,简称LR)、随机森林(Random Forest,简称RF)和梯度提升树(Gradient Boosting Decision Tree,简称GBDT)算法搭建跨境电商平台商品转化率预测模型——LRG。接着通过实例分析计算特征重要性排序、评价LRG模型的性能,并比较不同特征组合对LRG模型的影响。最后,为跨境电商平台以及平台内的卖家提供一定的指导建议。本文研究结果表明:平台类特征对于跨境电商平台商品转化率问题十分重要,LRG模型明显实现了对原单一逻辑回归模型的性能改进。特别地,原始数据集与文化认同感的特征组合可以进一步改善LRG模型的性能。

关键词:跨境电商;第三方平台;转化率;LRG

Abstract

In recent years, the cross-border electronic commerce industry has developed rapidly, and has become the mainstream mode of trade. Globalization driven by it is becoming more inclusive. At the same time, more and more cross-border electronic commerce platforms enter the market. Flow is the basis of conversion, and conversion is the source of profit for e-commerce enterprises. Faced with a broader market, relatively unfamiliar consumers and diversified consumer demand, accurate prediction of commodity conversion rate has become the key to improve market competitiveness for enterprises.

This paper mainly analyzes the relevant information of users browsing and purchasing on cross-border e-commerce platform, and builds a prediction model of commodity conversion rate. Firstly, this paper systematically introduces the related researches on the method of commodity conversion rate and typical algorithms. Then, by analyzing the relevant factors affecting commodity conversion rate on cross-border e-commerce platforms, this paper uses logistic regression (LR), random forest (RF) and gradient boosting decision tree (GBDT) algorithms to build a prediction model named LRG. After that, construct data sets to test the performance of this model, and further compare the impact of different feature combinations on the model. Finally, provide guidance for cross-border e-commerce platform and sellers within the platform. Results show that the platform features have a great influence on the final prediction results. The LRG model obviously improves the performance of the original single LR model, and adding cultural distance features to the original data set can further improve the performance of the LRG model.

Key Words:Cross-Border Electronic Commerce;third platform;conversion rate;LRG

目 录

第1章 绪论 1

1.1 研究背景及意义 1

1.2 国内外研究现状 3

1.2.1 跨境电商第三方平台 3

1.2.2 商品转化率 3

1.3 研究思路 5

第2章 理论基础 6

2.1 逻辑回归 6

2.2 随机森林 7

2.3 梯度提升树 8

第3章 模型构建 9

3.1 跨境电商平台商品转化率影响因素分析 9

3.2 跨境电商平台商品转化率预测模型 11

3.2.1 模型构建 11

3.2.2 评价指标 12

3.3 小结 13

第4章 实例分析 14

4.1 数据来源与说明 14

4.2 数据预处理与分析 16

4.2.1 数据预处理 16

4.2.2 数据分析 16

4.3 模型验证与结果分析 21

4.4 小结 24

第5章 结论与展望 25

参考文献 27

致谢 29

第1章 绪论

1.1 研究背景及意义

近年来,跨境电商行业迎来迅猛发展,并已成为主流的贸易方式,由它所驱动的全球化正在变得越来越普惠。世界经济一体化进程的快速前进、互联网技术的广泛应用以及电子商务的发展都为全球消费者进行跨境线上消费奠定了坚实基础。跨境电子商务是指不同关境的交易主体,通过电子商务平台达成交易、进行支付结算,并通过跨境物流送达商品、完成交易的一种国际贸易活动,具有全球性、无形性、匿名性、及时性、无纸化和快速演进的特征[1]。与传统外贸相比,跨境电商具备成本低廉和高效便捷的优势。跨境电商平台能够降低企业参与国际贸易的成本与门槛,网络化的国际供应链也使得国际贸易更加便捷。

全球金融危机以来,我国传统国际贸易发展速度放缓,而跨境电商占进出口贸易额比例一直呈上升趋势,成为我国外贸的重要增长点。特别是近几年,在外贸景气持续下降的大环境下,我国跨境电商呈现出爆发式增长,如图1.1。在2008年至2016年间,我国跨境电商交易规模年复合增速达到了25.7%,高于同期进出口贸易增速[2];在2018年,我国跨境电商交易规模达到9.1万亿元,用户规模超过1亿,跨境电商市场内需庞大[2];同时国内的海外电商渗透率水平还比较低,未来存在很大的提升空间。

图1.1 2020年我国跨境电商交易额预测[3]

特别地,跨境电商在我国得到了政府部门的高度关注与支持。2018年,我国颁布《电子商务法》来规范和约束电子商务市场,并为跨境电子商务的发展提供法律保障。我国还颁布了跨境电商新政,放宽零售进口限制、推进监管体系建设,进一步加大了对跨境电商的支持力度。此外,在2018年11月我国举办首届中国国际进口博览会,超40万名境内外采购商到会洽谈采购。以上举措都为我国跨境电商的发展带来新的机遇。

随着跨境电商的不断发展,越来越多的跨境电商平台进入市场。目前,我国跨境平台企业已超过5000家。按照运营模式,我国跨境电子商务可分为跨境B2B贸易服务和跨境网络零售两大类[4]。其中外贸B2B在我国跨境电子商务中占据主导地位,而跨境网络零售所占外贸份额较低。外贸企业间的电子商务交易(B2B)是指主要通过产品批发、定制等大量出货的方式,依托阿里巴巴国际站、环球资源、中国制造网、敦煌网等大型B2B交易平台,实现较大金额的交易。跨境网络零售包括外贸企业对个人的零售电子商务(B2C)和外贸个人对个人的网络零售业务(C2C),并以B2C模式为主。B2C主要是指借助外贸零售平台(如阿里速卖通、亚马逊)或自建独立网站(如兰亭集势、DX)与国外终端消费者和零售商直接交易;C2C主要是通过个人在eBay等平台上建立网店进行交易。跨境网络零售以终端消费者(个人)为服务对象,呈现出小金额、小批量和高频度的交易特征。

本文研究的对象是B2C跨境电商。目前,B2C跨境电商作为一股新兴的推动力量对我国对外贸易的影响逐渐显现。B2C模式能够为中小企业缩减中间环节,提高贸易效率和利润率,并且通过直接与客户进行交流,能够更精准地捕获需求,从而实现个性化服务;此外,面对更多的细分市场,跨境电商企业可以获得更多的市场机会。对于每一位跨境电子商务平台上的卖家而言,最关心的问题就是盈利,而盈利取决于商品转化率。商品转化率衡量的是在一个统计周期内,采取行动(比如注册、购买、下载)的用户与点击浏览的用户数量的比值,在本文中,转化行为指最终实现购买的行为。然而,现在大部分电商商家把主要的资源用于获取顾客流量,刘贵荣等人[5]写到电商企业花92美元获取顾客,只用一美元来转化顾客。流量是转化的基础,转化才是电商的利润源泉。对于跨境电商卖家而言,面对着更加广阔的消费市场、相对陌生的消费人群,更高要求与多元的消费需求,如何提高自身商品转化率才是提高市场竞争力的关键。

因此,通过分析影响用户从浏览到点击再到最后确认订单的多种因素,思考如何能利用平台的巨大流量最终实现成功转化成为每一个卖家的重中之重。此外,通过对商品转化率的分析和预测不仅可以判断跨境电商卖家广告投放后的市场效益,还可以探索近期的消费特征与消费趋势、制定相应的营销策略;同时可以合理分配广告预算,最终实现提高商品转化率、促进利润有效增长。基于以上背景,本文通过开展对跨境电商平台商品转化率预测方法的研究,希望能够为跨境电商平台以及企业的发展提供相关决策支持。

1.2 国内外研究现状

1.2.1 跨境电商第三方平台

按照平台建设者的不同可以将跨境电商平台分为自建平台和第三方平台。自建平台是指卖方作为产品供应方自己搭建的平台,从建设初期就需要持续投入成本,对企业实力要求较高。而第三方平台独立于产品(或服务)的供应方和需求方,通过网络服务平台,按照特定的交易与服务规范为买卖双方提供服务[6]。成熟的第三方平台(如亚马逊、速卖通、eBay、wish等)可以为卖方提供集成的支付物流服务、潜在的巨大流量、稳定安全的交易以及精准的目标市场,但同时也存在着繁多的运营规则限制、竞争激烈的问题。不过,对于规模较小、资金有限的中小企业而言,选择第三方平台是其长期开展跨境业务的最佳选择。

目前学者们关于跨境电商企业如何选择第三方平台有着很多研究。黄莉玲[7]通过文献研究的方式,从平台特性、成本因素、信息质量、系统质量和服务质量五个层面出发,构建了跨境电商第三方平台选择指标体系。并基于模糊神经网络模型,进一步构建了第三方跨境电商平台的选择模型。包小妹[8]通过比较国际主流跨境电商平台的优劣势,提出中小企业应根据自身需求、企业发展阶段和平台特点进行合理选择。邱彩红[9]以FZS公司为研究对象,深入分析其电商渠道现状,总结出平台的消费群体、平台流量、平台的收费情况、平台公平竞争环境、平台的服务五方面影响因素。吴珍彩[10]从系统质量、服务质量、平台基本性质、信息质量和价格因素五个维度构建了中小企业跨境电商第三方平台选择指标体系,为我国中小企业走向世界提供了指导意见。

1.2.2 商品转化率

当前对商品转化率预测的方法研究主要集中在广告转化率(Conversion Rate,简称CVR)方面,还有其他方面的研究包括好评转化率、点击转化率等。广告转化率预测在国内和国外都是一个比较新的课题,相关的研究还处在快速发展的阶段。Agarwal等人[11]放宽用户信息与“广告主—发布者对”之间的依赖关系,提出在用户特征上通过回归方法来估计用户信息条件下转化成功的概率,通过对“广告主—发布者对”预先定义的严格层次结构的概率推断来估计在其信息条件下转化成功的概率,如果在 “广告主—发布者对”条件下没有足够数量的转化成功事件,CVR的估计将基于其父节点,最后CVR即为二者相乘的结果。在其基础上,Kuang-chih Lee等人[12]提出了利用用户、广告主和发布者数据层次结构当中的过去性能观测值,生成不同层次组合下的CVR估计值,其次通过逻辑回归的方法将这些估计值进行组合以实现更为准确的识别,同时还解决了数据偏度和缺失特征的现实问题。当前,逻辑回归方法已经实现了广泛地应用,特别是在与提升决策树结合后获得了显著的性能,Narayan Bhamidipati等人[13]基于逻辑回归算法从头开始构建了一个可扩展的机器学习管道,来预测用户根据广告印象点击和安装应用程序的概率,并深入研究了如何利用顺序模型训练、深度学习和迁移学习来提高转化率预测的准确性。Hongxia Yang等人[14]提出了一种新的CVR概率生成模型——基于增强词建模的动态迁移学习(Trans-RWM),即通过紧密集成自然语言处理、动态迁移学习和可伸缩预测三部分来进行用户转换率的预测。该模型专门为CVR预测的语义输入量身定制的新的自然语言模型,并将知识动态地从源传递到未来目标。在面对CVR预测中出现的极稀疏转换和延迟反馈的挑战时,Lu Quan等人[15]提出了一个带有转换归因调整的安全预测框架,可以处理过度预测的问题,现已成功应用在雅虎上。为了解决广告点击与转化之间的时间延迟问题,Yoshikawa等人[16]提出了一种用于CVR预测的非参数延迟反馈模型,由于时间延迟的分布是根据广告内容和用户特征来建模的,所以它可以潜在地被表示成各种形状的分布,因此该模型通过不假定参数分布来表示时间延迟的分布。并且研究通过实验发现即使在分布复杂的情况下,该模型也能成功捕获合成数据集上的时间延迟分布。

国内的计算广告领域发展速度相较于国外而言有些缓慢。顾智宇等人[17]提出了基于描述广告、查询与用户三个因素与转化事件之间关系的概率因子图模型,并利用该模型对广告转化进行预测。赵杨等人[18]通过综合多种机器学习算法包括梯度提升树、随机森林、LightGBM、XGBoost、场感知因子分解机模型和Vowpal Wabbit,提出了APP广告转化率综合预测模型,有效地提高了转化率预测的精确性和有效性。虽然目前大多数研究只关注于模型本身,但是有越来越多的学者开始考虑更多的影响因素,该领域存在着极大地发展空间。

此外,还有不少学者对如何提高电商的转化率进行了研究。李彤[19]按照来源将电子商务访问流量分为直接和间接两类,并从这两个层面出发探索访问流量来源与浏览黏性和购买转化率的关系,提出了通过挖掘访客价值来提升转化率。刘贵容等人[5]从消费者的角度总结了影响电商转化率的九大因素,分别是消费能力、消费观念、访问目的、网站吸引力、浏览时间、网站服务、网站系统和购物体验等。并且进一步分析它们之间的关联程度,提出了综合的参考方案,比如适应消费者的消费能力和观念、提高网站吸引力和提高网站服务质量等。陶冶[20]以淘宝网为例,通过问卷调查的方式,提出了提升品牌网站影响力、提升商品吸引力、改进客户服务质量和提升用户体验价值四大对策。李忠美[21]对“电商 直播”模式进行研究,提出了提升转化率的建议。刘晔[22]以欧莱雅电商平台广告为例,探讨了影响互联网广告转化率的影响因素,总结出以“低价和赠礼”为基础、根据历史数据投其所好和挖掘消费者购买入口盲点等建议。

综上所述,国内外学者对商品转化率预测方法的深入研究为本文商品转化率预测方法的选择提供了坚实广泛的理论基础。通过分析对比,本文决定综合应用逻辑回归(Logistic Regression,简称LR)、随机森林(Random Forest,简称RF)和梯度提升树(Gradient Boosting Decision Tree,简称GBDT)算法搭建跨境电商平台商品转化率预测模型——LRG,来进行跨境电商平台商品转化率的预测。通过实验,本文计算特征重要性排序、比较LRG模型与原单一逻辑回归模型的性能差异,并进一步比较不同特征组合对模型性能的不同影响,最终就如何提高跨境电商平台商品转化率提出一定的指导建议。

1.3 研究思路

本文的研究思路如下:

第一章,论文绪论。主要包括对论文研究背景与研究意义的阐述,对跨境电商第三方平台、商品转化率的国内外研究现状进行简要分析,以及对论文的研究思路的阐明。

第二章,理论基础。主要论述逻辑回归、随机森林和梯度提升树三种算法,详细介绍算法原理及应用,为下文跨境电商平台商品转化率预测模型的搭建奠定理论基础。

您需要先支付 50元 才能查看全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图