法律状态公告日
法律状态信息
法律状态
2017-12-05
授权
授权
2015-07-08
实质审查的生效 IPC(主分类):G06K9/62 申请日:20150227
实质审查的生效
2015-06-10
公开
公开
技术领域
本发明涉及一种基于稀疏提升集成(SparseBoost)分类器的火星探测器软着陆过 程中陨石坑的检测方法,具体涉及火星表面图像中陨石坑的预处理、纹理特征抽取和选 择以及SparseBoost分类器的设计,属于图像处理和模式识别领域。
背景技术
火星探测器软着陆过程中障碍物检测研究主要目的在于检测出障碍物并据此确定 安全着陆区域。其中陨石坑是火星等天体表面最常见的地质形态,具有分布广、面积大、 图像特征明显等特点,是探测器软着陆过程中需要检测的最主要障碍物之一。
火星探测器采集的图像中陨石坑可以看作具有明亮和阴暗区域的一对月牙。在确定 的候选陨石坑中,通常对候选陨石坑的纹理特征进行抽取后,抽取的特征数据具有较高 的维度,必须通过合适的图像特征选择算法、监督学习分类算法对候选陨石坑中的陨石 坑和非陨石坑进行分类,以确定图像中陨石坑的具体位置。
SparseBoost分类算法是一种稀疏的监督学习分类算法,与现有的AdaBoost、Boost 算法相比的优势在于,在每次迭代过程中,AdaBoost算法利用全部特征集,而 SparseBoost算法仅仅选择一个最优的特征;同时在构建弱分类器的过程中,AdaBoost 和Boost算法均选择决策树构建分类器,计算过程中利用全部样本集,而SparseBoost 算法采用稀疏核密度估计RSDE-WL1构建弱分类器,仅利用少量样本实现。因此 SparseBoost算法具有稀疏性和降低计算复杂度的优点,实际过程中将SparseBoost分 类算法应用于火星探测器软着陆过程中陨石坑的检测,能够有效降低计算复杂度,实现 陨石坑的快速检测。
发明内容
1、发明目的
本发明的目的是提供一种基于稀疏提升集成分类器的火星探测器软着陆过程中陨 石坑的检测方法,该方法首先对采集的图像进行预处理以确定候选陨石坑,其次从候选 陨石坑中抽取图像纹理特征,并进行特征选择;然后将改进的稀疏核密度估计算法 (RSDE-WL1)与提升集成学习算法(Boost)相结合,构建稀疏提升集成分类器 (SparseBoost分类器),最后将SparseBoost分类器应用于陨石坑的检测,实现快速 检测,同时获取较高的分类准确度。
2、技术方案
为达到上述目的,本发明根据陨石坑自动检测的主框架图(图1)中的步骤,具体 介绍该方法的技术方案。
本发明设计了一种基于稀疏提升集成分类器的火星探测器软着陆过程中陨石坑的 检测方法,该方法包括以下步骤:
步骤1.确定候选陨石坑
确定候选陨石坑的关键在于图像中的陨石坑可以看作具有明亮和阴暗区域的一对月 牙,如图2所示。每对月牙的形状可以通过基于数学形态学的形状检测方法从图像中确 定,可以匹配的月牙作为候选的陨石坑。候选陨石坑的构建过程如图3所示,输入是一 张全色图像,其包含了很多明亮和阴暗特征区域。明亮和阴暗形状并行处理,通过使用 原始图像处理明亮形状,而使用倒置的图像来处理阴暗形状。该方法的目标是消除所有 无法指示为陨石坑的噪声特征,而只保留明亮和阴暗特征。剩下的明亮和阴暗特征区域 彼此匹配,将这些区域标注好,作为陨石坑的候选区域。
步骤2.候选陨石坑纹理特征抽取
为了从矩形特征方面来表示单个候选陨石坑,我们首先抽取候选陨石坑周围的方形 图像块。在实验中,为了包含周围陨石坑的边缘,我们使用候选陨石坑大小的两倍作为 遮盖区域。每个候选陨石坑未知的纹理特征使用9种不同大小的方形遮盖来编码,如图 4所示。因此,一张图像所包含的候选陨石坑的属性可以通过成千上万的纹理特征来描 述。这些特征并不相互独立,且这些完备的特征弥补了通过单一方形遮盖获得的纹理信 息的限制。
步骤3.对抽取的纹理特征进行特征选择
根据初步抽取的候选陨石坑纹理特征,由于特征数据的高维性,因此将训练样本和测试 样本输入分类器前,必须进行特征选择。本发明中,我们利用步骤4设计的SparseBoost算 法进行特征选择,其与AdaBoost算法的最大区别在于,前者是在每一次迭代过程中仅选取 一个最优的特征,而后者通常利用整个特征集。这样大大降低了训练样本的特征维数,有效 地减少了分类器训练的计算复杂度。
步骤4.将Boost算法与稀疏核密度估计算法RSDE-WL1结合,设计了稀疏提升集 成分类器,以实现对基于图像的陨石坑的快速检测。
根据所选择的候选陨石坑纹理特征,为了区分其中陨石坑和非陨石坑,本发明设计了一 种监督学习分类算法——SparseBoost算法。该方法结合Boost算法和一种改进的稀疏核密 度估计算法(RSDE-WL1),在选择特征子集的同时,构造若干稀疏核密度估计器用于相应基 分类器的设计,通过基分类器的加权组合,最终实现集成分类器。
给定n个候选陨石坑(x1,y1),(x2,y2),...,(xn,yn),其中yi=0,1,i=1,2,...,n分别对应着非 陨石坑(c0)和陨石坑(c1)实例,n0和n1分别对应着非陨石坑和陨石坑实例的数目, n0+n1=n。每一个候选陨石坑可以表示为一个特征向量x=(f1,f2,...,fm)T,其中每一个特 征fi,i=1,...,m是由候选陨石坑上某一特定位置的方形遮盖产生,m为抽取的特征总数。利 用SparseBoost算法(具体过程如算法1)构建一系列弱分类器ht(x),并通过加权集成方 法将弱分类器进行组合建立最终的强分类器H(x):
其中T是迭代次数(T<n),αt是学习的弱分类器ht(x)的权重。
在每次的迭代过程中,需要实现以下三个核心的步骤:弱分类器学习、最优特征选择和 下一次迭代过程样本权重更新。其中,在弱分类器学习过程中,对压缩集密度估计算法(RSDE) 加入惩罚项,得到改进的稀疏核密度估计算法RSDE-WL1。利用RSDE-WL1算法对每一种类别 属性估计其概率密度函数,根据贝叶斯决策规则对输入的样本进行分类,得到弱分类器。
(1)弱分类器学习
在第t次迭代过程中,针对选取的单个最优特征f∈{f1,f2,...,fm}构建的弱分类器ht(x), 可通过构建贝叶斯分类器来实现。在讨论关于陨石坑和非陨石坑分类的二类分类问题前,首 先介绍贝叶斯分类器。一般对于贝叶斯分类问题,期望估计给定输入样本x下类别的后验概 率密度。为了获得一个关于密度估计的概率分类器,首先为每一种类别属性c训练一个概率 密度估计器其中x为用于表示单个候选陨石坑的特征向量,β为核权值向 量,c为候选陨石坑的类别属性,c∈{c0,c1},c0表示非陨石坑类别,c1表示陨石坑类别。 然后运用贝叶斯规则(2)计算后验概率,最终测试样本被分配给具有最大后验概率的类别 属性。
对于本发明中二类分类问题,首先估计两个在给定类别下的条件概率密度和这两个密度可以通过后续的稀疏核密度估计RSDE-WL1得到(根据公式(5) 和(6)计算得到)。然后根据公式(2),分别计算相应的后验概率和(根据公式(2)直接计算得到)。根据每一种类别属性的样本数量,计算两种类别的先验概 率p(c0)和p(c1):p(c0)=n0/n,p(c1)=n1/n,p(c0)+p(c1)=1。最后利用贝叶斯决 策规则(3)对输入的样本进行分类
因此,弱分类器ht(x)的表达式为
其中两种类别属性下概率密度和的稀疏估计表达分别为:
m0和m1分别对应着两种类别属性下稀疏核密度估计RSDE-WL1表达式中非零核权值的个数, n0和n1分别对应着非陨石坑和陨石坑实例的数目,通常m0<n0和m1<n1。和为核权值 向量,βk为核权值系数(0≤βk≤1),h0和h1为核带宽(h0>0,h1>0),和为核函数。
其中,改进的稀疏核密度估计RSDE-WL1的简单实现过程如下:
首先介绍压缩集密度估计(RSDE)算法。RSDE基于经验积分平方误差(ISE)准则,以 全回归矩阵为基础,使尽可能多的核权值趋于0,从而得到密度p(x)的稀 疏表达式,其中Ki,k=Kh(xi,xk)为ΦN的第i行k列元素。明确地说,带有高斯核的RSDE估 计,其核权值向量β能够通过最小化积分平方误差得到,如下所示:其中,代表N×N 维矩阵空间;
式(7)中参数β与公式(2)中的参数含义一致,dx表示微分项,Ep(x)表示期望值;
其中项由于其与参数β无关,可以不考虑,Ep(x){·}表示关于密度p(x)的期望值。 将核密度估计表达式代入式(7),经过系列变换,得到带约束的非负 二次优化问题
约束条件βk≥0,1≤k≤N和其中,矩阵元素定义为 Gh(·,·)是高斯核函数,h为核带 宽,
为了降低权值系数在某些区域的聚集程度和提高密度估计的稀疏度,我们引入权值系数 的加权l1范数作为惩罚项,得到改进的稀疏核密度估计算法RSDE-WL1。也叫做 正则化项,其中为对角矩阵。定义w=[w1,w2,...,wN]T,βN=[β1,β2,...,βN]T,加入惩罚项后的新的二次优化问题为
注意到问题(9)是非凸的,利用相应的迭代算法求解上述问题可以得到权值系数的稀疏解。
(2)最优特征选择
计算弱分类器ht(x)的加权误差总和,选择满足最小误差的单个最优特征ft用于构建当前 迭代的最优弱分类器
ht(x)=h(x,ft) (11)
(3)下一次迭代过程样本权重更新
SparseBoost算法结合了AdaBoost算法中当前样本权重与过去所选特征的分类结果有关 这一信息,而这一信息有助于选择当前最优特征。实现过程中,加大被错误分类的样本权重, 而减小被正确分类的样本权重。在计算加权误差总和时,被错误分类的样本更可能在下一次 迭代过程被选中。权重更新表达式如下
3、优点及功效
本发明一种基于稀疏提升集成分类器的火星探测器软着陆过程中陨石坑的检测方 法,它与现有方法相比,其主要优点是:(1)分类器算法的时间复杂度是O(Tm(m0+m1)), 与Boost算法相比,Boost算法的时间复杂度是O(Tmn),由于m0+m1<n0+n1=n,因此在 时间复杂度上具有显著的优势。(2)在每次构建弱分类器时,仅仅选择一个最优的特 征作为样本向量,而不利用全部特征,降低了计算复杂度,加快了分类速度。(3)对 基于图像的陨石坑和非陨石坑进行分类,分类准确率能近似达到85%及以上,对实际的 火星探测器软着陆过程中陨石坑的检测有一定的参考价值。
附图说明
图1陨石坑自动检测主框架图。
图2(A)陨石坑月牙区域中解释一个陨石坑由像月牙一样的明亮和阴暗区域组成的物 理原理。
图2(B)一个真实的1km大小陨石坑的明亮和阴暗区域。
图3构建候选陨石坑流程图。
图4(A)2种2-矩形遮盖。
图4(B)2种3-矩形遮盖。
图4(C)5种4-矩形遮盖。
图4(D)一个对陨石坑2-矩形遮盖的实例。
图5(A)西区域陨石坑实际图像。
图5(B)中间区域陨石坑实际图像。
图5(C)东区域陨石坑实际图像。
具体实施方式
本发明一种基于稀疏提升集成分类器的火星探测器软着陆过程中陨石坑的检测方 法,该方法包括的步骤见图1。其主要思想是充分利用所设计的稀疏提升集成分类器具 有稀疏解和降低计算复杂度的优点,对基于图像的陨石坑纹理特征进行特征抽取和选择 后,实现对陨石坑和非陨石坑的分类,以达到陨石坑的快速检测。图2(A)-(B)为陨 石坑月牙区域中明亮和阴暗区域的物理原理及真实的实例。图3为构建候选陨石坑流程图。
本发明选择高分辨率立体摄像机(HRSC)全色图像最低点h0905_0000的一部分作为测 试集,该图像通过火星快速飞船拍摄,如图5(A)—(C)所示,所选择的图像分辨率是12.5 米/像素,大小是3000×4500像素(37500×56250m2)。领域专家在这张图片上手工标注 了大约3500个陨石坑作为地表的真实情况与自动检测结果进行比较。这张图片对于自动检 测陨石坑算法是一个重大的挑战,因为它包含了具有空间变化的形态,并且图像的对比度相 当差。将这张图片分为三部分,记为西区域、中间区域和东区域,西区域和东区域有类似的 地貌,但西区域比东区域有更多的陨石坑,中间区域与其他两区域相比具有明显不同的表面 地理特征。
步骤1、2:确定候选陨石坑以及候选陨石坑纹理特征抽取
根据候选陨石坑的确定方法,我们从全色图像5中初步确定了13075个候选陨石坑。通 过图4(A)—(D)9种方行遮盖的方法,从候选陨石坑图像中抽取了1089个图像纹理特征。 实验中训练集从东区域北半边的候选陨石坑中随机选择204个真实陨石坑和292个非陨石坑 实例组成,实验中来自西区域、中区域和东区域的测试集相应的候选陨石坑数分别为2935、 1181和1223。
步骤3:对抽取的纹理特征进行特征选择
为了实现选取特征数尽可能少,且分类准确度尽可能大,本发明对SpraseBoost算法的 迭代次数T分别设置为2、5、10、15、20、25、30、50、100、150、200,然后在西区域、 中区域及东区域分别测试了选取相应特征子集的分类结果。同时由于候选陨石坑数据中陨石 坑和非陨石坑分布的不平衡性,成功地检测出真实陨石坑比非陨石坑更重要。因此,本发明 使用准确率(Accuracy=(TP+TN)/(TP+TN+FP+FN))、查全率(Recall=TP/(TP+FN))、查准率 (Precision=TP/(TP+FP))和F测量值(F-measure=2/(1/(Recall)+1/(Precision)))作为 评价指标。其中TP表示被正确分类的真实陨石坑数目,TN表示被正确分类的非陨石坑数目, FP表示被错误分类为陨石坑的非陨石坑数目,FN表示被错误分类为非陨石坑的真实陨石坑 数目。
在迭代次数T的设置中,选择2个特征主要是因为候选陨石坑是由明亮和阴暗区域组成 的,因此代表明亮和阴暗的这两个特征是最重要的,最大选取200个特征是为了与其他文献 的实验结果相比较,中间的特征数是随机选取的。在特征选择过程中,利用Boost算法的思 路,在T次迭代过程中,每一次选取满足最小误差的单个最优特征ft,得到T个特征用于样 本集的构建,其中T<n。
步骤4:将Boost算法与稀疏核密度估计算法RSDE-WL1结合,设计了稀疏提升集成分类 器,以实现对基于图像的陨石坑的快速检测。
在分类器的设计中,主要包括三个核心的步骤:弱分类器学习、最优特征选择和下一次 迭代过程样本权重更新。首先进行初始化,对于输入样本的初始权重wi,如果yi=0,则 wi=1/2n0;如果yi=1,则wi=1/2n1,其中n0和n1分别对应着非陨石坑和陨石坑实例 的数目,n0+n1=n。在弱分类器学习中,设置参数λ=0.001,lmax=8,ε=1/(0.3*N),得 到改进的稀疏核密度估计器RSDE-WL1的密度估计表达式,再根据贝叶斯决策准则,得到每 次迭代过程中一个弱分类器ht(x)。在最优特征选择中,计算弱分类器的分类误差 选取满足分类误差最小的特征作为最有特征,设置γt=εt/1-εt。 最后为下一次迭代过程更新样本的权重从而得到T个弱分类器。将这T 个弱分类器进行加权组合成最终的强分类器,相应弱分类器的权重设置为αt=ln(1/γt)。
表1-3分别表示了在西区域、中间区域和东区域上,不同迭代次数所选取特征数和分类 准确率、查全率、查准率以及F测量值。从表1-3可以看出,在西区域、中间区域和东区域 三个区域上,当所选的特征数分别为10,20,20时,相应的分类准确率达到最高,分别为 0.790,0.854和0.874,同时F测量值也达到最大,分别为0.790,0.796和0.818。因此, 在训练集确定的情况下,对三个区域的测试数据进行分类时选取的最优特征数分别为10,20 和20。
表1 西区域
表2 中间区域
表3 东区域
选取四种用于陨石坑检测的监督分类算法与本发明提出的SparseBoost算法进行比较, 如Boost、AdaBoost、SVM及J48算法。Boost算法采用决策树作为基分类器,将提升集成 算法与特征选择算法融合在一起进行分类。而其它三种算法在实验过程中不能对原始数据集 进行特征选择。表4列出了这五种算法在西区域、中间区域和东区域上的分类准确率 (Accuracy)、查全率(Recall)、查准率(Precision)和F测量值(F-measure)。
表4 本发明陨石坑检测算法与其他四种陨石坑检测算法性能比较
从表4可以看出,在西区域和东区域上,有特征选择的分类算法(SparseBoost和Boost) 的分类准确率和F测量值都明显高于无特征选择的分类算法(AdaBoost、SVM和J48),其中 SparseBoost算法优于Boost算法。而在中间区域,有特征选择的算法与无特征选择的算法 相比,在分类准确率和F测量值上差别不大(如SparseBoost、AdaBoost和J48),甚至更 差(如Boost),这可能是由于采取的训练样本来自东区域,而中区域不同于东区域的特殊 地貌导致特征选择时丢失一些重要的特征信息,从图5(B)中可以看出中区域的地理形态 明显与西、东区域有较大差异。因此,总体看来,本发明所提出的SparseBoost分类算法在 陨石坑检测方面具有较好的分类效果,且计算复杂度是最小的。
最后所应说明的是:以上实施例仅用以说明而非限制本发明的技术方案,尽管参照 上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:依然可以对本 发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何修改或局部替换,其 均应涵盖在本发明的权利要求范围当中。
机译: 基于图像分割的基于稀疏表示的面板面积检测方法和系统
机译: 基于稀疏表示的近双重图像检测方法
机译: 基于塑料闪烁体的辐射探测器和使用该探测器的放射性核素检测方法