当前位置:蚂蚁文档网 > 作文范文 > 轨迹数据驱动交通路况统计分析

轨迹数据驱动交通路况统计分析

时间:2022-07-08 08:50:03 浏览次数:

  本 科 毕 业 设 计(论 文)

  学院(部) 计算机科学与技术学院 题

  目 轨迹数据驱动的交通路况统计分析

  年

 级 2014 级 专业 计算机科学与技术 班

 级 14 计科班 学号 1427405114 姓

 名 许赛君 指导老师 许佳捷 职称 副教授 论文提交日期 2018 年 5 月 19 日

 苏州大学本科生毕业设计(论文)

 I 目 目

 录 前

 言 ························································································ 3

 第一章 绪

 论 ············································································· 4

 1.1 研究背景与意义 ·································································· 4

 1.2

 本文的主要工作 ·································································· 5

 1.3

 本文的组织结构 ·································································· 5

 第二章 相关工作 ·········································································· 6

 2.1 轨迹数据地图匹配 ······························································· 6

 2.1.1 基于使用信息的地图匹配算法 ·········································· 6

 2.1.2 基于采样点范围的地图匹配算法 ······································· 7

 2.2 回归算法 ··········································································· 8

 2.2.1 线性回归 ···································································· 8

 2.2.2 CART 决策树回归 ·························································· 8

 2.2.3 集成算法 ···································································· 8

 2.3 本章小结 ··········································································· 9

 第三章 问题定义与总体设计 ·························································· 10

 3.1 问题形式化 ······································································· 10

 3.2 总体设计 ·········································································· 12

 3.3 本章小结 ·········································································· 12

 第四章 基于轨迹流的实时路况计算 ················································· 13

 4.1

 基于轨迹流的地图匹配算法 ·················································· 13

 4.1.1 候选点准备 ································································ 13

 4.1.2 空间分析 ··································································· 14

 4.1.3 时间分析 ··································································· 17

 4.1.4 结果匹配 ··································································· 17

 4.2

 最终算法描述 ···································································· 18

 4.3 路况计算 ·········································································· 18

 4.4 本章小结 ·········································································· 19

 第五章 缺失实时路况的自动化填补 ················································· 20

 苏州大学本科生毕业设计(论文)

 II 5.1 问题理解 ·········································································· 20

 5.2 相关算法模型 ···································································· 21

 5.3 特征工程与模型训练 ··························································· 23

 5.4 本章小结 ·········································································· 24

 第六章 实验 ··············································································· 25

 6.1 数据集 ············································································· 25

 6.2 参数设置与实验细节 ··························································· 26

 6.2.1 地图匹配 ··································································· 26

 6.2.2 回归 ········································································· 27

 6.3 实验结果 ·········································································· 29

 6.4 本章小结 ·········································································· 31

 第七章 总结与展望 ······································································ 32

 7.1 本文总结 ·········································································· 32

 7.2

 后续工作展望 ···································································· 33

 参考文献 ···················································································· 34

 致

  谢 ····················································································· 36

 苏州大学本科生毕业设计(论文)

 1 摘 摘

 要 近年来,随着科技的进步、定位获取技术和移动计算技术的发展,每天都可以收集无数的 GPS 轨迹信息。然而传感器捕获的轨迹经纬度通常不能反映真实位置与轨迹点所在的确切路段,这时就需要地图匹配技术(Map Matching)将轨迹点序列与数字地图的道路网络进行匹配,与道路进行关联。但是,轨迹数据采集过程中也存在一些问题,如采样率不稳定、存在噪声以及数据缺失。针对数据缺失问题,时空回归算法是一个较好的解决策略。

 现实情况中,轨迹数据的采集与分析通常是实时的,即数据一般处于流环境中。本文首先基于轨迹数据采集的现实情况,设计针对流环境的轨迹数据 Map Matching地图匹配算法,然后对大规模轨迹数据进行聚合分析,得到交通网络的实时路况。最后,考虑到物体移动轨迹的不确定性、采样数据缺失等因素会导致路段速度缺失。针对数据的缺失问题,本文使用时空回归算法进行填补操作。

 Map Matching 地图匹配在路径规划,实时导航和通用的路线发现等许多应用场景中是一个基本的预处理步骤,在对轨迹数据的统计分析中也尤为重要。与此同时,基于时空分析回归算法的应用针对数据缺失问题提供了较好的解决方案

 关键词:GPS 轨迹;流环境数据;地图匹配;回归算法

 苏州大学本科生毕业设计(论文)

 2 Abstract In recent years,

 with the development of science and technology of location acquisition, mobile computing technology, numerous of GPS trajectory information can be collected every day.

 However, the latitude and longitude of the trajectory captured by the sensor do not usually reflect the exact position where the actual position and the trajectory point locate.

 At this time, Map Matching technology is required to match the latitude and longitude sampling sequence of the driving trajectory with the digital map network.

 However, there are also some problems in the process of trajectory data collection, such as unstable sampling rate and noise, as well as missing data. The spatial and temporal regression algorithm is a good method to deal with the problem of data loss. In reality, the collection and analysis of trajectory data is usually real-time, that is, the data is generally in a streaming environment.

 Firstly, this paper designs the Map Matching algorithm for trajectory data of the flow environment based on the actual situation of trajectory data collection, and then aggregates the large-scale trajectory data to obtain real-time traffic conditions of the traffic network. Finally, the paper take the uncertainty of the object"s movement trajectory into account. Lack of sampling data and other factors will lead to the loss of speed on the road. To solve this problem, this paper uses spatial-temporal regression algorithm. Map Matching is a basic and important preprocessing step in many application scenarios such as path planning, real-time navigation, and general route discovery. It is also very important for statistical analysis of trajectory data. And at the same time, the application of spatial and temporal analysis regression algorithm provides a better solution to the problem of data loss.

 Keywords: GPS trajectories; data streams; map-matching; Regression algorithm

 苏州大学本科生毕业设计(论文)

 3 前 前

 言 近年来,随着科技的进步、定位获取技术和移动计算技术的发展,每天都可以收集无数的 GPS 轨迹信息。然而,GPS 数据采集过程中有时会出现定位误差,一些传感器捕获的原始坐标数据通常不能反映真实的位置。这时需要使用地图匹配技术(Map-Matching)将轨迹点匹配到数字地图的路段。

 现有的地图匹配算法根据当前可获得的轨迹数据信息进行划分,可以分为几何算法、拓扑算法、概率算法和高级算法。几何地图匹配算法利用路网的几何信息,主要考虑 GPS 点与道路的长度、宽度、形状等几何属性之间的关系;拓扑地图匹配算法充分利用了路网的连通性、GPS 轨迹点和路网关系进行分析;基于概率的算法首先查找候选路段,然后在设定误差范围内的概率值进行选择;其他高级算法会使用一些高级方法如卡尔曼滤波器,隐马尔可夫的应用模型等。

 本文主要以流环境下的轨迹数据为研究对象,对轨迹数据先进行 Map-Matching,处理匹配 GPS 轨迹到数字地图上的道路的问题,再进行路况速度计算,通过时空回归算法实现缺失路况的自动化填补。本文完成的主要工作及创新之处有:

 (1)本文设计了针对流环境的轨迹 map-matching 地图匹配算法,充分利用轨迹数据信息与路网信息进行分析,考虑多重影响因素,从而得到最优匹配结果。

 (2)本文分析轨迹数据,利用实现的 map-matching 结果进行路况计算,对大规模轨迹数据进行聚合分析,得到交通网络的实时路况。

 (3)本文针对数据的稀疏性问题,通过时空回归算法实现缺失路况的自动化填补。

 (4)本文在真实的轨迹数据和路网数据上进行了实验,从而验证了本文的方法具有较好的结果。

 苏州大学本科生毕业设计(论文)

 4 第一章 绪

 论 本章主要阐述了地图匹配技术与回归算法的研究背景以及意义,对现有的地图匹配算法进行了研究和总结,介绍了回归算法。然后说明了本文的主要工作和论文的组织结构。

 1.1 研究背景 与 意义

 近年来,随着科技的进步、定位获取技术和移动计算技术的发展,每天都可以收集无数的 GPS 轨迹信息。轨迹信息通常由一连串形成轨迹的经过筛选的 GPS 点序列组成,GPS 信息一般会包括:位置信息(经度和纬度)、行驶速度、时间戳、行驶方向等信息。海量的轨迹数据可进行分析并且应用于日常生活中,如从出租车中采集到的大量轨迹数据能够直接反映城市的实时拥堵情况,我们可以将轨迹数据应用于估算车辆行驶时间、进行交通异常探测和交通路线的优化和设计等智能交通领域;轨迹数据还可以反映城市人口在一定的时空范围内的变化,根据人群在空间内的分布情况,通过聚类方法,进行有效的功能区划分 [1] 。轨迹数据目前主要用于城市计算,在智能交通领域、划分城市功能范围区、实时导航、路径规划等方面都有广泛的应用。

 然而,由于 GPS 轨迹数据会存在通信质量和定位等方面的问题,一些传感器捕获的原始坐标数据通常不能反映真实的位置。这时就需要使用地图匹配技术(Map-Matching)将轨迹点匹配到数字地图上的路段,这对很多基于轨迹数据的挖掘、应用与服务而言,是一个很重要的研究问题。

 现有的地图匹配算法大多只适用于轨迹数据离线的情况,不能应用于实时流环境下的数据。考虑到这一点,本文设计了基于流环境下的轨迹数据的 Map-Matching 算法,处理匹配 GPS 轨迹到数字地图上的道路的问题,再进行路况速度计算,对大规模轨迹数据进行聚合分析,得到交通网络的实时路况。

 在得到道路交通的实时路况之后,物体移动轨迹的不确定性、采样数据缺失、采样频率过低、传感器出错等因素会导致路段速度缺失。针对路况信息缺失的问题,时空回归算法是一个较好的解决策略。目前来说多种回归技术可用于预测:线性回归(Linear Regression)使用最合适的直线方程拟合因变量和一个或多个自变量; CART决策树回归也是一种典型的回归技术,适用于数据包含大量特征且数据特征之间有紧密联系的情况;在机器学习中,使用集成学习(Ensemble learning)可以将弱学习器

 苏州大学本科生毕业设计(论文)

 5 结合成强学习器,综合各学习器的效果,从而获得更加优异的泛化性能。

 1.2

 本文的主要工作

 本文主要以流环境下的轨迹数据为研究对象,对轨迹数据先进行 Map-Matching,处理匹配 GPS 轨迹到数字地图上的道路的问题,再进行路况速度计算,最后通过时空回归算法实现缺失路况的自动化填补。本文完成的主要工作及创新点有:

 (1)设计了针对流环境的轨迹 map-matching 地图匹配算法,充分利用轨迹数据信息与路网信息进行分析,考虑多重影响因素,从而得到最优匹配结果。

 (2)分析轨迹数据,利用实现的 map-matching 结果进行路况计算,对大规模轨迹数据进行聚合分析,得到交通网络的实时路况。

 (3)针对数据的稀疏性问题,通过时空回归算法实现缺失路况的自动化填补。

 (4)在真实的轨迹数据和路网数据上实现了本文的方法,可以充分验证本文方法的合理性和可行性。

 1.3

 本文的组织结构

 本文共分为七章,各个章节主要内容有:

 第一章:绪论。本章介绍了研究背景与意义、现有的 map-matching 算法与回归技术,然后说明了本文的主要工作与文章组织结构。

 第二章:首先介绍对轨迹数据进行地图匹配的相关工作,其次再介绍可用于实现缺失路况的自动化填补的回归算法等相关工作。

 第三章:主要介绍了论文中的问题定义和总体设计思路。本章首先介绍采样元组、采样轨迹、路段、道路网络和地图匹配的定义;接着阐述回归的定义。然后提出了基于流数据的路况计算和缺失路况填补的解决思路。

 第四章:本章详细介绍了基于轨迹流的实时路况计算方法,并给出了每个步骤的处理算法。

 第五章:本章阐述了缺失实时路况的自动化填补算法,并对整个数据分析方法进行详细说明。

 第六章:本章对第四章和第五章提出的算法进行实验,并说明了实验参数设置与实验细节,最后给出了实验结果。

 第七章:总结全文,提出未来工作的设想与展望。

 苏州大学本科生毕业设计(论文

 6 第二章 相关工作 本章首先介绍了对轨迹数据进行地图匹配的相关工作,其次再介绍可用于实现缺失路况的自动化填补的回归算法等相关工作。本章详细阐述了现有的地图匹配算法及其原理与现有的回归算法与原理。

 2.1 轨迹数据地图匹配

 近年来,随着道路交通网络的日益发达、科技的进步、定位获取技术和移动计算技术的发展,每天都可以收集无数的 GPS 轨迹信息。全球定位系统 GPS(Global Position System)进行卫星和地面设备基站之间的通信,接收 GPS 数据。但是采集到的轨迹数据由于各种原因总会有一些误差,这些误差主要来自传感器和卫星传播的延迟、信息接收时内部噪声、通道延迟。为了得到较为准确的轨迹信息,我们需要对GPS 导航定位误差进行校正,这时要利用地图匹配技术将轨迹点匹配到数字地图的路网中,从而提供准确的定位轨迹数据。

 地图匹配技术的基本思想是以轨迹点始终在道路上为前提,根据获得的轨迹点和已知的路网信息,将 GPS 定位得到的轨迹点位置信息和数字地图进行比较,将轨迹点投影在路段上,并得到轨迹点在路段上的确切位置,从而达到对 GPS 定位的轨迹数据进行修正的效果。

 2.1.1 基于使用信息的地图匹配算法 根据地图匹配需要的数据进行划分,现有的地图匹配算法可被分成以下几种:1、几何地图匹配算法;2、基于拓扑结构算法;3、概率统计算法;4、高级地图匹配算法。

 基于几何的匹配算法利用路网的几何信息,主要考虑 GPS 点与道路的长度、宽度、形状等几何属性之间的关系。点对点匹配的基本方法就是一个简单的几何匹配算法,该方法将每个 GPS 点与道路网络中最近的节点进行匹配。Phuyal 等人提出了curve-to-curve matching 算法 [2] ,他们的算法首先通过点对点匹配来识别候选节点;其次,利用 GPS 轨迹和与道路网对应的候选路段曲线构建曲线,并比较两条曲线之间的距离,找出最相似的路段作为最佳匹配。在几何匹配算法中,不考虑道路之间的连通关系,其匹配的时间较短,然而由于考虑的因素较少使得准确性不高。一般而言,

 苏州大学本科生毕业设计(论文)

 7 几何地图匹配算法就是进行简单的搜索,每一个车辆 GPS 轨迹点一般都会被匹配到距离其最近的路段。这种算法的弊端也十分明显,简单的搜索最近路段进行匹配、不考虑道路连通性和路网密集程度势必会导致大量的匹配结果有误,所以这种方法在交通网络分布密集的城市和交叉路口处会出现准确率较低的匹配结果;而且,距离轨迹点最近的路段不一定是正确的匹配结果。

 为了解决几何匹配算法中的问题,[3][4]中提出考虑路网和轨迹点之间的拓扑关系以及道路之间连通性、路网密集程度和形状,因而产生了基于拓扑的地图匹配算法。

 概率统计算法在轨迹点附近设置一个范围,利用轨迹的各种信息以及与之前匹配路段的关系信息在该区域范围中获得一个概率;若在一定置信度区域内没有路段的话,则认为该轨迹点不在路网范围内。

 高级地图匹配算法有使用卡尔曼滤波器 [5] ,隐马尔可夫的应用模型错误 ! 未找到引用源。

 等数学模型。隐马尔可夫模型(HMM)算法最近被广泛用于地图匹配,因为该模型考虑了从 GPS 轨迹的起点到终点的所有状态。在[7] 错误!。

 未找到引用源。中提出了一种基于 HMM 的地图匹配算法,该算法将 GPS 噪声建模为零均值高斯的发射概率,将转移概率定义为 GPS 位移和匹配路径之间的距离差概率。

 IF-Matching 算法是一种基于信息融合的地图匹配方法 [8] ,该方法使用多个信息来描述一个移动物体,为地图匹配建立模型。该方法考虑全局效应,认为一个点与上下文位置有关,一个移动对象可能会受到随之移动的物体的影响。IF-Matching 方法不仅考虑到空间几何以及道路网络的拓扑结构,还考虑到移动物体的状态,因此,它会比较实用合理。该方法包含空间和时间分析,从而可以适应复杂的现实情况。

 2.1.2 基于采样点范围的地图匹配算法 现有的地图匹配方法还可以根据使用的轨迹点数量进行划分。可将其分为增量算法和全局算法。增量地图匹配算法对获得的轨迹点进行逐次增加轨迹点数量的匹配。这种方法在当采样频率相当高时,计算和执行方面速度很快,然而,其表现随着采样频率的减少而敏感,有时会导致次优解。全局算法用道路网络批量处理整个输入轨迹,现有的地图匹配技术大多都是基于全局考虑的思想进行研究。

 Interactive-Voting Based Map Matching 方法 [9] 是一种全局算法,该方法主要考虑了 3 个影响因素:1.position context 临近参考点 2.Mutual influence 一个点 C 可以作为周围参考点,也可以作为其他点的参考点。3.Weighted influence 离得远的点的权值

 苏州大学本科生毕业设计(论文)

 8 和离得近的点的权值影响不同。该算法由候选准备、得分矩阵建立、交互投票和路径选择这 4 个阶段组成,找到的是全局最佳路径。

 2.2

 回归算法

 回归是使用统计学方法,分析研究大量数据,得出自变量与因变量之间的联系。

 2.2.1 线性回归 线性模型的基本形式:已知

推荐访问:统计分析 路况 轨迹

猜你喜欢