基于机器学习的轨迹数据分析与可视化开题报告
2020-06-23 20:50:51
1. 研究目的与意义(文献综述包含参考文献)
1.研究背景及意义
移动互联网、卫星定位、lbs(location-based service)等技术的不断发展,使得带有定位功能的移动智能设备被广泛使用。人们在使用这些设备的同时也主动或被动地记录了大量的历史移动轨迹,并被持久化保存,形成了时空轨迹(spatial-temporal trajectories)数据。时空轨迹是地理空间加上时间轴所形成的多维空间中的一条曲线,可以表示移动对象在一段较长时间范围内的位置变化。每段轨迹由一系列时空采样点构成,其中每个采样点记录了经纬度、时间、速度、甚至人与社会交互活动等信息,刻画了人们在时空环境下的个体移动和行为历史。从宏观角度来看,轨迹数据中不仅蕴含了群体对象的泛在移动模式与规律,例如人群的移动与活动特征、交通拥堵规律等,还揭示了交通演化的内在机理。在大数据时代,人们通过轨迹分析等手段进行知识发现,并将它们运用在各种交通和位置服务应用系统中,包括交通导航、城市规划、服务推荐、交通指挥、物流配送、车辆监控等。在此背景下,轨迹大数据管理被学术、工业界大量研究,轨迹数据分析与挖掘已经成为数据挖掘领域的一个重要的新兴分支。但是随着数据规模的指数级增长,应用需求的飞速提升,现有的轨迹数据存储、计算和分析方法面临诸多局限,亟需突破轨迹数据的处理架构、分布式算法等关键技术。基于机器学习的轨迹数据分析是指用机器学习中的算法,如随机森林(random forest)、线性回归(logistic regression)、支持向量机(support vector machine, svm)等分类器以及主成分分析(principal components analysis, pca)、t分布随机邻居嵌入(t-distributed stochastic neighbor embedding, t-sne)等降维算法对轨迹数据进行数据分析。
2.轨迹数据分析的应用
2. 研究的基本内容、问题解决措施及方案
1.拟研究或解决的问题
本课题拟研究以下内容:对于某个轨迹数据集,对其进行相应的数据处理,然后使用机器学习中的算法对处理过的轨迹数据集进行数据分析和聚类,并对相关的结果进行降维处理,以便可视化。
2.拟采用的研究手段(途径)