基于众源地理数据的湖北省旅游景区热点分析毕业论文
2021-05-13 22:47:39
摘 要
众源地理数据是自发性地理信息(VGI)的范畴,为数据采集和获取提供了一种新的途径。本文以微博位置签到数据为例,详细叙述了该数据的获取方法,结合面向文档的能处理JSON等复杂数据结构的高性能数据存储媒介MongoDB,将位置签到数据存储到本地。然后采用聚类分析的方法研究旅游景区的关注度分级,并从空间、时序和客源三个角度,利用综合制图、空间插值和统计分析等手段对湖北省旅游景区的关注度进行分析,得到湖北省旅游景区的空间分布特征、淡旺季分布规律和客源分布特征。并从这些角度对湖北省旅游景区开展分析评价,为湖北省旅游资源规划和管理提出有益的参考和建议。
关键词:众源地理数据;旅游景区关注度;签到数据;MongoDB;聚类分析
ABSTRACT
Crowdsourcing geographic data is in the scope of Volunteered Geographic Information(VGI) , it provides a new channal for data collection . By taking Weibo poi check-in data as a example, this paper details the acquisition method of poi check-in data of microblog, combining MongoDB, a high performance database which is documents-oriented and can handle with complex data struction like JSON, to store poi check-in data locally. Then discuss the grade of tourist destination awareness based on the hot cluster methods. And by taking the method of integrated graphics, spatial interpolation and statistical analysis, this artical analysed tourist destination awareness of Hubei province in the perspective of spatial, time and tourists source. Then get the result of spatial distribution feature, seasonal distribution regulations and tourists source distribution feature of tourist destination awareness in Hubei. Finally I evaluated tourist attractions of Hubei and putted forward comments and suggestions for the planning and management of tourism in Hubei.
Key Words: crowdsourcing geographic data; tourist destination awareness; check-in data; MongoDB; cluster analysis
目录
第1章 绪论 1
1.1 研究背景与意义 1
1.2 国内外研究现状 2
1.2.1 众源地理数据 2
1.2.2 旅游景区关注度 2
1.3 研究内容与目标 3
1.4 论文结构与技术路线 3
第2章 相关理论基础 6
2.1 众源地理数据 6
2.2 旅游景区关注度 7
第3章 众源地理数据的采集与存储 8
3.1 数据源的选取 8
3.2 数据采集 8
3.2.1 技术路线 8
3.2.2 获取景点名称 9
3.2.3 获取景点中心点和景区半径 11
3.2.4 获取签到数和照片数 13
3.2.5 获取时间线数据 15
3.2.6 获取客源数据 16
3.3 数据存储 16
3.3.1 数据存储媒介的选取 16
3.3.2 数据导入MongoDB 16
3.4 数据的采集结果 16
第4章 旅游景区热点分析 18
4.1 关注度分析 18
4.2 空间分析 20
4.3 时序分析 22
4.4 客源分析 23
4.5 湖北省旅游景区管理对策与建议 24
4.5.1 旅游景区管理现状 24
4.5.2 对策与建议 25
第5章 总结与展望 26
5.1 总结与结论 26
5.2 不足与展望 27
参考文献 28
致谢 30
第1章 绪论
1.1 研究背景与意义
当今时代步入了大数据时代,数据成为各行各业必不可少的一部分,在GIS领域中,数据成本更是平均占到总成本的70%。因此,如何能够高效便捷地获取实时有效的数据成为一个技术难题。众源地理数据(Crowdsourcing Geospatial Data)是众包思想和地理数据的有机结合[1],它采用维基百科的机制,汇集小流成江海,充分发挥每一个普通大众的力量。众源地理数据作为地理数据的一种新兴来源,是由大量非专业人员志愿获取并通过互联网向大众或相关机构传播与分享的一种开放地理空间数据[2 ]。在Web2.0这个用户贡献数据而非单向获取服务的时代,这种双向协作服务模式产生的众源地理数据,区别于传统测绘部门和商业手段获取的数据,充分利用普通大众的力量,为解决数据采集这一难题提供了新的思路。
在旅游产业中,旅游者是旅游活动的一个重要组成部分,其网络行为通常包括旅游信息交流、旅游经历和经验的分享,其中分享的内容包含了大量游客的既往旅游信息,如人员组成、时间行程、路线选择、景区景点、旅游过程和态度评价等[3]。这些信息常常以微博、微信、论坛等信息的形式在网络上展示,它在某种程度上能够反映景点的关注度,并且填补了旅游地理学中数据采集流程的一些空白。与问卷调查统计数据相比,它具有更丰富的内容。与搜索引擎检索结果相比,它具有更精细的空间尺度和时间尺度[3]。
本文是在自发性地理信息(Volunteered Geographic Information)的时代背景下,将众源地理数据与旅游景区热点分析相结合。在旅游地理学方面,众源地理数据为其提供了更精细的数据来源,为解决旅游景区负载不均衡、平衡游客和景点的供需关系,以及避免旅游安全问题提供了解决思路。在应用层面,对于用户合理安排旅游行程,缓解景区容量和游客之间的供需关系有指导意义。同时能为旅游景区科学控制游客流量,提升景区服务质量和应急能力提供技术和数据支持。此外,还可以为旅游景区规划与管理提出参考和意见,从而促进湖北省旅游业的发展。
1.2 国内外研究现状
1.2.1 众源地理数据
众源地理数据蕴含着丰富的空间信息,通过空间数据挖掘手段可以从中提取信息、获取知识。目前众源地理数据的研宄范围主要集中在众源地理数据的信息采集与更新方法、众源地理数据的分析与挖掘方法和众源地理数据的质量评价三个方面。
在众源地理数据的采集与更新方法方面,Marcus利用OSM(OpenStreetMap)生成高分辨率的城市三维通用数据模型,建立了三维城市数据库[4]。Michael等人以美国圣巴巴拉市的大型火灾为例,研究得出通过搜集众源地理数据可以帮助建立灾后道路数据库,为难民提供有效的逃生路线[5]。Matthew等人研究了在海地地震中众源地理数据的应用,市民通过OSM高效快速地建立了包含房屋、道路等地物信息的震后地理数据库[6]。