匹配算法论文(精选5篇)

  • 匹配算法论文(精选5篇)已关闭评论
  • A+
所属分类:文学
摘要

藏文信息处理存在着分词的问题,而藏文分词是对藏文词性标注、藏语音合成、机器翻译、大型语料库建设和信息检索等藏文信息处理的基础。藏文分词的效果会对进一步研究的藏文词性标注、藏语音合成、机器翻译、大型语料库建设和信息检索等藏文信息处理软件的性…

匹配算法论文(精选5篇)

匹配算法论文范文第1篇

【关键词】藏文分词 匹配算法 哈希表 词典机制

1 引言

藏文信息处理存在着分词的问题,而藏文分词是对藏文词性标注、藏语音合成、机器翻译、大型语料库建设和信息检索等藏文信息处理的基础。藏文分词的效果会对进一步研究的藏文词性标注、藏语音合成、机器翻译、大型语料库建设和信息检索等藏文信息处理软件的性能和效果产生影响。

为了提高分词的准确率,需要有一个足够大的词库,面对足够大的词库,对词库中的词语的搜索技术就显得十分重要,对词库中词语的搜索速度直接关系到分词系统的性能。词库目前主要是采用索引的机制来实现的,一般用到的索引结构的包括线性索引、倒排表、Trie树、二叉树等。线性索引、倒排表都是静态的索引结构,不利于插入、删除等操作。

2 分词

2.1 词典机制算法

本系统采用的是基于Hash索引的分词词典。分词词典机制可以看作包含三个部分:首字Hash表、词索引表、词典正文。词典正文是以词为单位txt文件,匹配过程是一个全词匹配的过程。首先,通过首字Hash表确定该词在词典中的大概位置,然后根据词索引表进行定位,进而找到在词典正文中的具置。该系统是采用Myeclipse10平台,使用Java语言进行实现的,直接调用Java里的hashmap创建函数,找到该词之后,然后进行字符串匹配。

2.2 基于匹配算法分词

主流的分词方法有三种:分别为基于语言学规则的方法、基于大规模语料库的机器学习方法、基于规则与统计相结合的方法,鉴于目前藏文方面还没有超大型的句子语料库。该系统便采用了基于语言学规则的根据词典进行匹配的方法对藏文进行分词。

根据匹配的方向不同,分为正向和逆向两种匹配算法。本系统采用的是正逆向匹配算法相结合的减字匹配法对藏文进行分词的,因为藏文在每个字的结束时,都会以“”作为分界;每个句子会以“”或者“” 作为分界。因此,对藏文进行分词的减字算法首先以藏文的字符“”或者“”切分出句子,如此一来,原文就被分为相应的若干个句子了。接下来,再对每一个句子进行词典的匹配,如果没有匹配成功就根据藏文字符中“”从句末尾减去一个字符,然后再次进行匹配,直到匹配成功为止。对每个句子重复这些流程,直到每个句子全部分解为词为止。逆向最大匹配是从句子的末尾选择计算最大词的长度,从后往前匹配、切分,其基本原理是和正向最大匹配的原理是相同的。

为了提高切分的精度,该系统使用的是正向最大匹配和逆向最大匹配相结合的方法进行分词,先分别采用两种方法分词,然后根据概率比较两种分词结果,选择概率较大的那种匹配算法作为分词结果。

本系统的逆向最大匹配和正向最大匹配均是采用减字匹配算法,减字算法实现简单,切分效果也比较理想,流程如图1所示。

正向最大匹配(MM) 对于文本中的字串 ABCD,ABCD?W,若ABC∈W,并且AB∈W,然后再判别CD是否属于W,若是,则就切分为AB/CD,如果不是,则切分为AB/C/D。其中W 为分词的词典。逆向最大匹配对于文本中的字串 ABCD,ABCD?W,BCD?W,CD∈W,并且AB∈W,其中W为分词的词典,那么就取切分 AB/CD,根据藏文词组最长的为6个字符组成的,所以进行匹配算法的时候,初始化藏文最大字符串长度为6,流程图如图2所示。而逆向最大匹配算法是从句子的末尾开始进行匹配,其核心算法与正向最大匹配算法相同,只不过开始匹配的方向不同而已。

无论是正向匹配(MM)算法还是逆向匹配(RMM)算法都会产生大量的歧义字段。我们很容易举出这样的例子,如:(五十六个民族心连心)这一句藏语,采用正向匹配算法分词的结果为:,采用逆向匹配算法的分词结果为:,在采用逆向匹配的时候,将会被划分为,而(五十六)实际是一个词,不该划分,诸如此类的藏文句子还有很多,例如 等,无论使用正向最大匹配算法或者使用逆向最大匹配算法都会产生歧义,这种歧义称为组合歧义。为了减少这种歧义的影响,本系统使用两种分词方法相结合的方式。首先分别使用两种算法进行分词,然后通过统计的方法消除部分歧义。具体实现为:设正向最大匹配算法所切分的n个词分别为,则这个句子切分的频率则为;设逆向最大匹配算法所切分的n个词分别为,则这个句子切分的频率则为。如果,则选择正向最大匹配算法所切分的结果,反之,则选择逆向最大匹配算法所切分的结果。

3 结果和分析

结合26个大小不同的实验文本,对基于哈希表索引和匹配算法的分词系统的准确率进行了分析,准确率如图3所示。结果显示,该分词系统的准确率在92%以上。由此可得基于哈希表索引和匹配算法的分词系统在准确率上有不错的效果。

参考文献

[1]华却才让.基于树到串藏语机器翻译若干关键技术研究[D].陕西师范大学,2014.

[2]石方夏,邱瑞,张|,任帅.藏文信息隐藏技术综述[J].物联网技术,2014,12:28-32.

[3]王思力,张华平,王斌.双数组Trie树算法优化及其应用研究[J].中文信息学报,2006,05:24-30.

[4]陈硕,桂腾叶,周张颖等.信息检索在论文写作和项目申报中的应用[J].科技展望,2015,13:274-275.

[5]黄昌宁,赵海.中文分词十年回顾[J]. 中文信息学报,2007,03:8-19.

[6]奉国和,郑伟.国内中文自动分词技术研究综述[J].图书情报工作,2011,02:41-45.

[7]贺艳艳.基于词表结构的中文分词算法研究[D].中国地质大学(北京),2007.

[8]戴上静,石春,吴刚.中文分词中的正向增字最大匹配算法研究[J].微型机与应用,2014,17:15-18.

[9]刘遥峰,王志良,王传经.中文分词和词性标注模型[J].计算机工程,2010,04:17-19.

作者简介

陈硕(1995-),男,自治区拉萨市人。本科在读,主研领域为自然语言处理,数学建模及其应用。

周欢欢(1994-),女,湖南省衡阳市人。本科在读,研究方向为数学建模及其应用、交通运输规划与管理。

通讯作者简介

赵栋材(1976-),男,现为大学藏文信息技术研究中心副教授。主要研究方向为藏文信息处理。

作者单位

匹配算法论文范文第2篇

关键词:被动定位,匹配场,水下GPS,动目标分析

 

1.引言

声纳按照工作方式一般分为主动声纳和被动声纳。对于被动声纳,由于它不发射声波,它具有很好的隐蔽性,且具有作用距离远、不容易被发现等优点,在军事领域中有着很好的应用前景。近年来,世界各国都加紧了对被动定位技术的研究和开发,被动定位技术受到广泛的重视。随着水中兵器作用距离和打击精度的提高,对被动声纳的定位性能提出了更高的要求,远程定位问题引起人们的广泛关注,出现了多种新型的定位方法。

2.传统被动声纳定位技术及面临的问题

2.1 传统的被动定位技术

传统的水声被动定位技术是六十年代研究开发出来的,这类定位技术利用沿不同距离路径传播的水下声脉冲间的时间差或相位差对水面、水中目标进行定位,其典型代表就是三子阵法和球面内插法。三子阵被动测距方法是己经实用化了的被动定位技术,它是六十年代后期出现的噪声测距方法。它利用时延估计技术求出到达三个基阵的相对时延,然后得到目标的方位和距离。但是,三子阵定位方法对水声信道进行了简化,三子阵系统是在同一平面内进行定位的,它不考虑信道声速的垂直分布,也不考虑信道的多途效应。,动目标分析。,动目标分析。不过这种定位方法算法简单,而且对近距离声源定位能达到较高的精度,目前在工程上已经得到广泛应用。

2.2 传统被动声纳定位技术面临的问题

传统被动定位方法在理论和实际应用中都存在很大的缺陷,主要表现在以下两个方面。

2.2.1 远程定位精度不高

传统的被动定位方法,利用球面波或柱面波波前曲率的变化,通过测量各基元的相对时延,估计目标的距离和方位。测距精度与时延估计精度、目标距离、方位、基阵孔径、基阵安装精度等因素有关,其中时延测量精度是关键,然而对于有限的基阵孔径,随着声纳探测距离的增加,波前曲率的变化越来越小,加上信道传播起伏的影响,时延的精确测量以及距离信息的提取变得越来越困难,因此传统的定位方法难以实现远程定位。此外,由于海洋中的声速分布是不均匀的,特别在远距离定位时,声速的不均匀分布使传统的定位算法存在较大的误差。为此,研究人员必须寻求新的被动定位方法。

2.2.2 定位效果受声场环境影响大

由于海水介质的不均匀性,在海水信道中由于温度、盐度、压力的不同,导致了海水介质中各点的声学特性差异很大,特别是不同深度层的声学特性差异很大,导致了声波在海洋中的传播非常复杂,声传播受海洋信道的影响比人们想象的要大得多。要提高声纳的探测效果,必须要充分研究海洋信道特点。

3. 匹配场被动定位技术

匹配场声源定位是国际上新兴的水声定位方法,它根据海洋声信道性,在声场建模的基础上,运用一定的匹配场处理算法反演声源位置。匹配场定位技术充分利用了海洋信道特点来反演声源位置,因此它可以有效消除信道对定位的影响,它的定位精度比传统的被动定位精度高。

3.1 匹配场被动定位原理[1]

匹配场定位的被动原理图如图1所示。匹配场定位首先将水听器阵列接收到的数据经过傅立叶变换后计算频域协防方差矩阵。假设声场中某一位置有目标,已知海洋声场环境参数时,利用现有的声场模型可以计算出该目标声源产生声信号在接收水听器阵列处的声场值,通常称之为拷贝场向量。最后将拷贝场向量和测量信号的协方差矩阵进行匹配运算从而输出定位模糊表面,如果实际目标位置与假设声源位置一致,则匹配处理器有最大值输出,这样从定位模糊表面上可以读出目标的位置。

图1 匹配场定位原理图。

3.2 匹配场被动定位关键技术及发展趋势

匹配场定位有两个重要环节,一是拷贝声场的计算,二是匹配处理器的设计。拷贝声场可利用现有的声场模型计算得到。,动目标分析。现有的声场模型主要有简正波模型、声线模型、抛物方程模型等。其中,最常用的2种传播模型是射线模型和简正波模型。射线模型具有简捷、直观的特点,适用于描述深海声场。在浅海存在严重的多途和较强的海底散射,射线模型不再适用。简正波模型考虑了各种海底边界的影响,适用于研究浅海、低频的声传播问题。目前声传播模型的研究主要集中在快速、高精度的声场模型的研究上。

匹配处理器就是将拷贝场与实测声场进行匹配运算的算法,从理论上来说,匹配场处理器是传统的阵列信号处理的波束形成概念的推广,因此,很多传统的阵列处理方法都可以用于匹配场处理,而且人们已经证明其中的很多方法是很有效的。按照匹配场处理器的权向量是否与测量数据有关,将其分为线性匹配处理器(CMFP)和自适应匹配处理器(AMFP)。常用的MFP处理器有线性处理器(Bartlett)、最小方差估计器(MV)和匹配模处理器(MMP)。随着人们对传播理论研究的深入以及阵处理技术的飞速发展,匹配场处理技术的研究取得了一些突破性的进展。近年来,匹配场处理技术逐渐走向实用阶段,宽带、稳健自适应[1]、高分辨率[2]的匹配场处理技术成为研究热点,以试验研究带动理论研究成为主要的研究方法。,动目标分析。

4.水下GPS定位

水下GPS技术的设计灵感来自于GPS,该技术可以用于潜艇定位,进行爆炸军火处理,还能用于水雷对抗许多领域。水下GPS利用空间GPS系统在海洋中布放一系列声纳浮标,形成网格,在水面用空间GPS,在水下用水声通信。法国的ASCA公司已经开发了用水下全球定位系统进行搜索与救援的系统,它可以利用水下的GPS信号确目标的三维坐标。,动目标分析。该系统可以用于跟踪水下的飞机或潜艇中黑匣子的声波发器,从而找到目标。系统包括GPS浮标,控制站及声波发送器。浮标下有水听器,浮标通过水面上的三个天线与指挥、控制、通信等系统联系。利用目标发射的信号与浮标接收信号的时间延迟得到浮标和目标的相对位置,同时,利用分GPS接收机能精确测量出浮标的精确位置。空间GPS技术已相当成熟。,动目标分析。

5.结束语

由于传统的被动定位方法在理论和实际应用中都存在一些问题,研究人员致力于研究新的被动定位方法,其中匹配场被动定位技术充分利用了海洋信道,在远距离复杂水文条件下,其定位精度较高,有着诱人的应用前景,随着研究的不断深入,这项技术正逐步走向实用阶段,但匹配场的模型精确性,匹配算法的计算速度以及匹配场的定位的稳健性问题还急需解决。水下GPS技术系统使用条件相对苛刻,不适用于非合作被动目标的探测,工程应用受到了一定的限制。

参考文献:

[1]杨坤德,等.水声信号的匹配场处理技术研究[D].西北工业大学,2003,06.

[2]周俊山,陶进绪等.一种基于MUSIC算法的匹配场定位方法[J].电子技术,2010,01:21~23.

匹配算法论文范文第3篇

关键词:SURF算法;度不变性;改进ORB;图像匹配;特征提取

图像特征匹配是指通过分别提取两个或者多个图像的特征(点,线,面等特征),对特征进行参数描述,然后运用所描述的参数来进行匹配的一种算法。图像特征点匹配是计算机视觉领域的重要部分,广泛地应用与图像处理,遥感数据分析,模式识别等邻域[1,2]。SURF(speeded-up robust features)[3]由H.bay在分析总结多种特征检测方法的基础上提出,并在2008年完善。本文提出一种基于改进的ORB算法,实现特征点的快速检测及匹配。主要思路是:先用SURF算法检测特征点,分配给特征点一个主方向,然后采用ORB中的BRIEF[5,6]描述子对特征点进行描述[7~10],最再利用基于二进制串的Hamming距离进行特征点匹配。本文算法的匹配速度和ORB大致相当,并且克服了ORB不具备尺度不变性的缺陷。

1SURF特征点提取

这里的0.9是权重系数的经验值。

只有当Hessian矩阵的近似值大于零且大于周围邻域的点的值时,才可能是极值点,,取该点的上下层中对应 3*3*3 的立体邻域来进行非极大值抑制,只有比立体近邻内的 26个响应值都大的点才被选定为特征点。

2ORB特征点描述子

由于生成的描述子是二进制码串的形式,因此使用Hamming距离进行特征点匹配比较简单。匹配上的点与非匹配点有着明显的不同,由此设定阈值,实现特征点匹配。

3 实验结果分析

本文的测试环境是Visual Studio2013,进行编程仿真,计算机硬件系统是Window7[Inter Core i3-2100 CPU3.1GHz],SURF及ORB调用OpenCV的相应算法函数。

为了有效的说明本文算法在尺度发生变化下,同ORB,SURF算法的特征点匹配算法的差异,在来自CMU图像库中的10000张样本图片训练集中,随机的统计8组数据。

本发明算法的极值点匹配度远高于传统算法ORB,匹配准确度约为96.0%,比ORB匹配准确度提高了约73.4%,表明了发明算法在尺度不变性能上的优越性,同时,在匹配精确度上,同SURF算法的精度可认为大致相当。

算法的实用性可对算法的匹配时间做对比。随机地选取8组测试图像,其中的4组来自上述尺度不变性能的实验图像,其余四组不存在尺度不变,只存在旋转,平移,光照等变化:

本发明的平均匹配时间约为46.8ms,比ORB长约19.1ms可认为大致相同,而SURF的平均匹配时间约为492.6,约为本发明的7.8倍,即本发明算法的匹配速度比SURF快约7.8倍,表明了本发明算法的快速优越性。

4结论

结合SURF算法的思想,提出基于ORB算法的改进,有效的解决了ORB算法不具备尺度不变性的特点,并且保留了ORB算法快速的特点,降低了图像特征向量生成的时间复杂度,简化算法,增加其鲁棒性,通过分析得出以下结论:

(1)本文算法有效的解决了在图像尺度发生变化的时能准确的进行特征点匹配,其平均匹配准确度高达96.0%,相比ORB算法有了很大的提高。

(2)本文算法的匹配时间相比ORB长约19.1ms,可认为大致相同,但是相比于SURF快了7.8呗,计算速度有了很大的提高。

(3)本文算法的采用Hamming距离进行特征点匹配,并没有对特征点进行进一步筛选,以及在进行特征点检测时没有获得图像的精准邻域,在有大量的特征点时会对匹配点检测及精度造成影响,这也是本文算法下一步的研究方向。

参考文献

[1] 张开玉,梁凤梅. 基于改进SURF的图像配准关键算法研究. 科学技术与工程,2013;13(10):2875-2879

[2] Sinha S N, Frahm J M, Pollefeys M, et al. Features tracking and matching in video using programmable graphics handware. Machine Vision and Application, 2011; 22(1):207-217.

[3] BAY H; TVTELLARST; Goll L VAN. SURF:speeded up robust feature 2006.

匹配算法论文范文第4篇

关键词:特征点匹配;投票策略;图像拼接

医学影像学是现代医学的主要组成部分之一,医学图像是医生用来诊断疾病和确定治疗方案的主要依据之一。医学图像配准、医学图像拼接以及医学图像的三维重建等图像处理技术具有重要的临床应用价值。图像特征点不仅能反映图像的大致轮廓,而且对噪声、角度、尺度等不敏感,并能大大较少计算量,因此基于特征点的配准、拼接等技术应用较为广泛[1,2]。但这些技术的关键在于如何提取图像特征点,以及如何使特征点达到精确匹配。

医学图像与其它图像相比,具有噪声大、图像细节多、对比度低等特点,本文采用对噪声、旋转不敏感的Harris改进算法[3,4]提取图像的角点作为特征点。另外,人体解剖结构存在相似性及对称性,因此采用一般的方法很难做到特征点的精确匹配,从而严重影响图像的后期处理。根据医学解剖图像的空间几何变换属于刚体变换[5]或近视为刚体变换,如脊柱、骨骼以及颅骨固定的大脑等图像,本文提出一种基于双向异步投票策略的特征点匹配算法。

1 角点投票策略

1.1投票策略 投票选举[6]是生活中很常见的一种选举方法,属于社会选择理论,且取得了很大的成效。由于两个特征空间内的角点匹配问题,从某种角度讲可以认为角点匹配就是待配准图像的角点之间按照某种规则进行一一选择。基于此,我们将投票策略应用于角点匹配当中,且算法的有效性已经得到钱为等人[5]的证明。具体思想如下。

首先对投票选举进行角色分配,如表1所示。

投票标准:特征空间A中角点间距离与特征空间B中角点间距离相等的个数作为每个候选者针对每个竞争职位所得的票数,票数最多着为相应职位的胜出者。

投票规则:采用黑盒式投票,即每个候选者均可参与全程职位竞争,且每个在一个职位竞争中胜出者仍可参与其它职位的竞争,即投票过程当中,不进行投票结果的揭露。

根据文献[5]可得具体投票思想如图1所示。

当然,此种投票方式很可能出现"一对多"的现象,并不能使各角点达到一一对应,也会严重影响优化最佳变换模型的速度。基于此问题,本文提出如下的基于双向异步投票的思想进行角点匹配。

1.2基于双向异步投票策略的角点匹配 所谓"双向"投票是指两个特征空间互相对对方投票选择,即当表1中的"候选者"对"竞选职位"可进行角色互换,彼此对对方进行竞选。若所有的成员都参与两轮竞选的话,尤其是孤立的特征点(没有与之匹配的角点)或者噪声点的参与,会严重影响角点匹配过程的计算速度。基于此问题,本文提出"双向竞选"需建立在异步的基础上,即必须在第一轮竞选结束后,才能进行角色互换,并且在角色互换前应剔除一些已经筛选出来的孤立点和噪声点。异步双向投票的示意图如图2所示。

具体实现步骤如下所述。

1.2.1按照图1所示的投票竞选流程图所示进行第一轮投票竞选,并暂时保存第一轮"投票竞选"结果。

1.2.2剔除特征空间B中的孤立点:因为是以A中所有点作为"竞选职位"进行投票,那么通过第一轮竞选后,B中未找到与之匹配的点可认为是孤立点,剔除孤立点后的特征空间B另记为新的特征空间B',但要保留特征点原来的序号。

1.2.3第二轮投票竞选:此轮投票可按照以下步骤进行。

1.2.3.1重新分配投票当中的角色:将特征空间B'作为"竞选职位",特征空间A为"候选者",其他角色不变。

1.2.3.2计算特征空间B'内各个角点间的欧式距离矩阵 T。

1.2.3.3扫描第一轮的投票结果,若显示A中Pi与B中^Pj匹配,那么就比较R中第i行与 T中各行相等的元素个数,若^Pj所得票数最多,那么可以确定Pi 与^Pj成功匹配,不再参与其他角点的匹配;若不成功,则进行其他点的投票匹配。

1.2.3.4第二轮投票结束后,若还存在"一对多"的现象,可剔除A中孤立点,将新的特征空间记为A',然后按照步骤1~3进行二次投票。

由于我们在角点提取的时候,加入了区域因子和距离因子,因此在实际的角点匹配当中,步骤3结束就会准确找出一一对应的匹配点。

2 结果与讨论

对来自医学影像技术论坛的两幅待拼图像进行试验结果如下。采用单向投票以及异步双向投票策略进行的角点匹配结果如图3、图4所示。

在角点初始匹配的基础上,采用RANSAC算法剔除误匹配,并优化估计出最佳变换模型,角点最终匹配结果如图5所示。

从图3、图4可以明显看出,单向投票策略中避免不了"一对多"的现象发生;而基于异步双向投票的角点匹配算法避开了"一对多"的现象,并且算法中并没采用"二次投票"。本实验中的异步双向投票策略角点匹配算法的运行时间只需几毫秒(采用VC++6.0编程)。。

3 结论

本文根据医学图像的特点,提出的基于双向异步投票策略的角点匹配算法不仅能有效避免匹配当中的"一对多"现象,更能有效正确找出匹配点。并且粗匹配的高精度也有效减少了优化算法的工作量。

文中的基于双向异步投票策略的角点匹配算法,是采用像素点的欧氏距离作为投票标准,只能应用于图像的刚性变换。设想,利用仿射变换的性质:变换后平行关系不变,在文中投票算法中引入"方向一致性"或马氏距离作为投票标准,解决图像的仿射变换配准问题。

参考文献:

[1]AGFA company,ADC compact full-leg/full-spine application software user manual[M].published by Agfa-Gevaert N.V.,B-2640 Mortsel-Belgiun 2214A GB 1998,11

[2]P.Smith,D.Sinclair,R.Cipolla,K.Wood.Effective Corner Matching[J].British Machine Vision Conference

[3]C.HarrisandM.J.Stephens.A combined corner and edge detector[J].In Alvey V-ision Conference,1988,147-152.

[4]ZHANG Xiao-hong.LI Bo.YANG Dan A novel Harris multi-scale comer detection algorithm[J].]Journal of Electronics and Information Technology,2007(07).

[5]QIAN Wei,FU Zhi-zhong,LIU Ling-qiao,etc.Voting-strategy-based Approach to Image Registration[J].Opto-Electronic Engineering,Oct,2008.

匹配算法论文范文第5篇

关键词:浮动车;GPS;地图匹配;轨迹点

引言

建立城市交通综合信息平台,通过对庞大的城市交通网络中的实时交通信息进行深入分析,为改善城市交通信息服务水平,提高决策科学性,缓解城市交通拥堵提供了基础。交通综合信息平台的数据支撑来源于交通基础信息的实时采集,科学决策的依据在于数据分析的快速、准确。

GPS浮动车是获取道路实时车速便捷有效的方法,可以通过车载GPS定位信息获取道路实时车速及运行状态(拥堵、畅通、缓行),其作为一种便捷廉价、可操作性高的车速采集手段已经被各城市普遍采用,特别是公交车与出租车安装车载GPS设备最为常见。通过对公交车及出租车的GPS返回数据与城市道路网的匹配、分析来获取道路的实时车速,进而实现对道路状态的有效判断。因此确保GPS浮动车轨迹点数据与信息平台电子地图快速、准确匹配是管理决策的基础,研究准确适用的GPS浮动车轨迹点数据的地图匹配算法是非常重要的。

1 GPS数据的地图匹配原理

地图匹配(Map-Match)简称MM技术,就是利用电子地图的路网信息和GPS数据来实行对车辆行驶准确位置的确定,它是一种定位误差修正技术。

浮动车所上报的GPS数据中包含有经纬度等地理信息,但这些GPS坐标只能反映车辆位置情况,而不能与实际路网路段直接相关联。因此,车辆在路网中行驶的情况,必须要依赖于地图匹配算法来完成车辆位置信息与路网位置的关联。

地图匹配算法的直接目的是将GPS测得的车辆位置或行驶轨迹,与现有的电子地图道路路段数据进行比较,继而找到车辆所处的道路,计算出浮动车辆在道路上所处的位置。一般地图匹配过程有以下几个步骤:

(1)通过对获取的GPS数据的预处理及匹配模板的分析、描述,提取出点和道路的轨迹特征。

(2)根据对地图匹配规则的制定,计算出GPS样本和匹配模板两者的相似度、匹配度。

(3)选取待匹配点距离最近或者是轨迹相似度、匹配度最高的道路曲线模板,可更正匹配样本的位置或轨迹,作为匹配结果[1]。

图1 地图匹配原理图

地图匹配原理一般可分成两个过程来表达:即寻找GPS待匹配点最可能归属的道路,并将GPS浮动点投影到这条它所归属的道路上面。

以上两个过程的关键在于需找GPS待匹配点最可能归属的道路,基本的思想即是在GPS点四周一定范围内搜索所有的可匹配点,然后根据匹配度计算,淘汰匹配度较低的点,选出最优点。并将此最优点作为GPS浮动车车辆的当前行驶路线。这样,寻找最优点成为算法性能优劣的关键所在,如果搜索范围过大,需对周围各条道路一一筛选,增加了算法计算量,导致匹配速度缓慢。反之,如果搜索范围过小,则有可能未能准确寻找到最佳匹配点,出现匹配错误,降低匹配的准确率。

2 基于GPS轨迹点的浮动车地图匹配算法

可实现地图匹配的算法很多,在GPS数据量极大,且算法应用的场景为实时车速展示,需要选择一个合适的方法,保证匹配的准确性和匹配速度。因此文章提出的地图匹配算法是基于GPS点到校正点的匹配,并且利用连续几个GPS点的轨迹确定结果,最终获取较为正确的路网匹配结果。

2.1 网格匹配

Step1:计算GPS点所归属网格。

当在系统中导入GPS数据信息后,可从这些原始数据中提取出坐标信息。可设为(x,y)。然后对该GPS坐标信息进行可信度检测,首先取网格划分中最大和最小的两个坐标点,其中最大的坐标点位于地图的右上角,假设为(xm,ym),最小的坐标点则位于地图的左下角,假设为(xn,yn)。如果待匹配点坐标(x,y)满足以下条件:

则认为该GPS点在研究坐标范围之内,转到下一步计算。

Step2:搜寻所在网格匹配

根据该GPS点的坐标信息,在网格列表中搜寻其所属的网格。假设网格编号为G0,若

(x,y)∈{G0}

则判定该点位于G0网格内。

在搜寻到所在网格后,将所在网格G0中的所有校正点加入到待匹配集合。但在该匹配中需要注意的是当GPS点与网格边距离小于1/3时,则需要将其相邻网格(G1……G8)所包含的校正点一并加入待匹配集合,进行匹配度计算。(见图2)

2.2 节点匹配

Step1:计算GPS与路段的距离和方向差

在网格匹配中搜寻出的校正点集合被称为待匹配集合。需要将GPS点与带匹配集合中的各个校正点进行匹配,找寻出最佳匹配点。

计算GPS点与各待匹配校正点之间的距离。设GPS点坐标为(x,y),GIS校正点坐标为(xr,yr),由于两点距离较近,两点接近于平面,则可根据平面距离公式

得出GPS点与各校正点之间的距离d。

计算GPS点与路段各校正点之间的夹角。取GPS数据的角度为?渍0,再与网格内的GIS路段校正点的切线方向角度?渍r(取正北方向为0°)求差值。可得出GPS点与路段方向的夹角α。

Step2:匹配度计算

匹配度是判断校正点优劣的重要标准,是描述GPS点与一条道路的匹配程度,用实际算法所求得的数值进行量化,匹配度越大,就认为发出这个GPS数据的浮动车越有可能位于这条道路。对于匹配度的计算,主要考虑的是GPS与路段的距离及其与路段的夹角。

图3 GPS点匹配

Step3:Confidence Point(CP点)判断

针对GPS浮动车地图匹配的特殊性,本文提出了Confidence Point判断。所谓Confidence Point,就是可信点[8]。判断是否为CP点,主要判断其所有匹配点是否位于同一路段。

由于浮动车地图匹配的最终目的是为城市各条道路得到路段平均速度提供起点、终点以及时间信息,而当车辆距离路口(包括城市立交路口、普通平面交叉路口、主辅路的出入口等)比较近时,由于GPS浮动车减速、并线等驾驶行为导致GPS数据中的方向信息等变化较大、准确性降低,使得系统比较难以确定车辆的准确位置。 但是考虑到GPS浮动车地图匹配的一个最终目的是获取路况实时信息,因此,如果无论车辆当前在哪条道路上行驶,只要能确定车辆必定通过或者必定离开某个路口,就可以根据GPS浮动车辆的下一个GPS定位数据确定其这一段时间的行驶轨迹。

因此当GPS数据处于路口节点或分合流点附近时,它所对应的匹配点并不在同一路段上,系统将这样的数据判定为非CP点,作为延迟匹配点,利用行驶路径进行匹配。反之,若GPS数据所对应的匹配点位于同一路段,则系统将其判定为CP可信点,对其各匹配点进行匹配度计算。

其中对于CP可信点,系统按照step3中匹配度计算中所确定的方法进行匹配度计算。取匹配度最大的点为最佳匹配点。对于非CP点,则转入下一步。

Step4:延迟匹配

对于上一步所提到的非CP点,并无法通过单一的GPS数据匹配来确定浮动车的确切位置,这时就需要通过相同浮动车的多个GPS数据来联合判断车辆的行驶路线轨迹。

图5 非CP点延迟匹配示意图

假设某浮动车连续的n个GPS数据组成的序列Pn(n=1,2,3,……,k),满足以下条件:

(1)P1点为CP点,P2为非CP点,且k小于延迟匹配的允许最大值;(2)Pk为已经确定的CP点,并能按照地图匹配方法正确寻找到最佳匹配点。

则可利用前后两个CP点P1和Pk,寻找这相邻两个CP点的最短路径L。再利用最短路径L对P2,P3,Pn-1进行匹配,去掉不属于L的匹配点,再取最大匹配度点作为最佳匹配点。

3 结束语

文章所使用的地图匹配方法通过获取GPS浮动车数据,利用GPS坐标信息,通过比对电子地图各条路段的地理信息,将浮动车位置关联到路网上。

研究表明,该匹配算法具有以下优缺点:

(1)匹配速度快。由于将电子地图网格化,避免了将GPS数据坐标与地图中所有节点坐标的一一进行计算,而是仅选取了比较小范围的节点进行匹配。提高了运算、匹配的效率。

(2)匹配精度较高。由于在匹配方法上采取了多种方法进行联合使用,针对不同位置的GPS数据点运用不同的匹配方法,保证了每个GPS数据点匹配的准确性。特别是基于连续GPS点轨迹来判断位置,使得匹配的结果更为准确。

重庆市政府在2011年开展“重庆市交通综合信息平台”建设,信息平台对重庆城区的干路网交通信息进行采集与汇聚。文章的研究依托交通信息平台的基础数据,研究成果应用于重庆市主城区路网运行情况的评估与监控,经过实测对比,验证了该算法的良好精度和适用性。

参考文献

[1]张其善,吴金培,杨康凯.智能车辆定位导航系统及应用[M].北京:科学出版社,2002.

[2]肖锋.面向道路交通状态监测的GPS与GIS数据预处理关键技术研究[D].重庆大学硕士毕业论文,2008.

[3]重庆市交通综合信息平台试点工程技术报告[R].2012.

[4]孙棣华,等.基于预处理的城市路网拓扑结构构建算法[J].计算机工程与应用,2008(08).

[5]车莉娜.车辆导航定位中的关键技术研究[D].辽宁工程技术大学硕士论文,2008.

[6]Weiliang ZENG, Zhaocheng HE and Xiwei SHE. Data Repair Method for Real Time Urban Link Speed Estimation,ASCE2011.

[7]王华.GIS城市道路最短路径算法研究[J].测绘科学,2010.

[8]章威,等.基于大规模浮动车数据的地图匹配算法[J].交通运输系统工程与信息,2007(4).