首页> 中国专利> 一种基于因子分析模型的高光谱数据降维方法

一种基于因子分析模型的高光谱数据降维方法

摘要

一种基于因子分析模型的高光谱数据降维方法,其步骤如下:(1)高光谱数据读入;(2)建立高光谱数据降维的因子分析模型;(3)计算数据的均值、协方差矩阵以及相关矩阵;(4)计算数据相关矩阵的特征值和标准化特征向量;(5)由参数估计方法进行因子载荷矩阵的求解;(6)计算因子分析模型中特殊因子的协方差和数据变量的共同度;(7)计算基于方差最大的因子载荷旋转矩阵;(8)利用基于加权最小二乘方法计算因子得分;(9)得到表征高光谱数据的本征维数,实现高光谱数据降维。该方法是一种自动的高光谱数据降维方法,能够有效的去除高光谱数据波段间的相关性、增加地物不同类别间的可分性。

著录项

  • 公开/公告号CN101487892A

    专利类型发明专利

  • 公开/公告日2009-07-22

    原文格式PDF

  • 申请/专利权人 北京航空航天大学;

    申请/专利号CN200910078443.1

  • 发明设计人 赵慧洁;李娜;蔡辉;贾国瑞;徐州;

    申请日2009-02-23

  • 分类号G01S7/48;G06K9/62;

  • 代理机构北京慧泉知识产权代理有限公司;

  • 代理人王顺荣

  • 地址 100191 北京市海淀区学院路37号北京航空航天大学仪器科学与光电工程学院

  • 入库时间 2023-12-17 22:18:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-04-08

    未缴年费专利权终止 IPC(主分类):G01S7/48 授权公告日:20120926 终止日期:20140223 申请日:20090223

    专利权的终止

  • 2012-09-26

    授权

    授权

  • 2012-05-23

    著录事项变更 IPC(主分类):G01S7/48 变更前: 变更后: 申请日:20090223

    著录事项变更

  • 2010-04-14

    实质审查的生效 IPC(主分类):G01S7/48 申请日:20090223

    实质审查的生效

  • 2009-07-22

    公开

    公开

说明书

技术领域

本发明涉及一种基于因子分析模型的高光谱数据降维方法,属于高光谱数据处理方法与应用技术领域,适用于高光谱数据降维的理论方法和应用技术研究。

背景技术

高光谱成像仪是一种新型的遥感载荷,其光谱具有紧密、连续的特点,可以同时记录被测同一地物的光谱和空间信息特征,因此,高光谱数据维数高且数据量大;由于光谱分辨率较高,各个波段之间具有较高的相关性,存在了大量的冗余信息。并且随着波段数据的增加,数据处理量呈指数上升。因此,如何将高光谱数据降维,消除波段间的相关性,成为数据处理的关键环节。

目前针对高光谱数据降维已经提出了很多方法,主要分为波段选择和特征提取两大类。波段选择的目的是将n维高光谱数据用具有代表意义的m维(m<n)数据子集代替,该类方法的问题是虽然较好的保留了原图像数据的特性,但是损失了高光谱数据的信息量以及光谱细节信息;特征提取的目的是将n维高光谱数据压缩到m维(m<n)模式空间中,使类别间的可分性最大。因此,该类方法在数据降维的同时突出了图像数据间的差异性,但改变了数据的原有特性。目前数据降维方法主要存在的问题是:不能很好的保留数据提供的所有有用信息,不能将相同类型地物特征表示在相同的波段中。

发明内容

本发明的目的是针对现有高光谱数据降维方法损失数据信息等不足提出一种基于因子分析模型的高光谱数据降维方法。

本发明的技术解决方案是:本发明一种基于因子分析模型的高光谱数据降维方法,具体是指一种因子分析模型将高光谱高维空间数据降到表征高光谱数据本征特性的低维空间的方法。该方法主要是利用因子分析模型,并通过计算因子载荷矩阵、基于方差最大的因子载荷旋转、计算因子得分得到表征高光谱数据的本征维数,从而实现高光谱数据降维。

本发明一种基于因子分析模型的高光谱数据降维方法,其步骤如下:

(1)高光谱遥感数据读入;

(2)建立高光谱数据降维的因子分析模型;

(3)计算高光谱数据的均值、协方差矩阵以及相关矩阵;

(4)计算数据相关矩阵的特征值和标准化特征向量;

(5)由主成分解方法进行因子载荷矩阵的求解;

(6)计算因子分析模型中特殊因子的方差矩阵和数据变量的共同度;

(7)计算基于方差最大的因子载荷旋转矩阵;

(8)利用基于加权最小二乘方法计算因子得分;

(9)得到表征高光谱数据的本征维数,实现高光谱数据降维。

其中,步骤(2)中所述的“建立高光谱数据降维的因子分析模型”,其因子分析模型为:

X=μ+AF+ε

式中,X=(x1,x2,...,xp)′是可观测的随机变量,均值μ=E(X),X的公共因子F=(F1,F2,...,Fm)′(m<p)是不可观测的随机变量,且满足均值E(F)=0、方差D(F)=Im(即F各个分量方差为1且互不相关),特殊因子ε=(ε1,ε2,...,εp)′与F互不相关,且满足均值E(ε)=0、方差D(ϵ)=diag(σ12,σ22,...,σp2)=defD;公共因子一般对X每一个分量都起作用,而特殊因子只对X的某一分量起作用,而且特殊因子之间以及特殊因子与公共因子之间互不相关;因子载荷矩阵A=(aij)p×m是待估计的系数矩阵,在因子分析中,特殊因子起残差或噪声的作用。

其中,步骤(3)所述的“计算高光谱数据的均值、协方差矩阵以及相关矩阵”,其计算方法如下:

X=1nΣt=1nX(t)=(x1,x2,...,xp)

V=1nΣt=1n(X(t)-X)(X(t)-X)=defVij

R=(rij)=(VijViiVjj);(i,j=1,2,...,p)

式中,X为数据的均值;V为协方差矩阵;R为相关矩阵;n表示像元数目;X(t)表示第t个像元。

其中,步骤(4)中所述的“计算数据相关矩阵的特征值和标准化特征向量”,其含义说明如下:计算相关矩阵R的特征值为λ1≥λ2≥…≥λp≥0,以及各个特征值对应的施密特正交化的特征向量l1,l2,…,lp

其中,步骤(5)中所述的“由主成分解方法进行因子载荷矩阵的求解”,其计算方法如下:

首先根据λ1+λ2+···+λmλ1+···+λm+···λp0.9的最小整数,确定公共因子个数m;

然后利用主成分解的方法求解因子载荷矩阵:利用步骤(4)中计算得到的相关矩阵R的特征值为λ1≥λ2≥…≥λp≥0,对应的施密特正交化后的特征向量为l1,l2,…,lp,则利用相关矩阵R的谱分解:R=Σi=1pλilili,得到因子分析模型的一个解:A=(λ1l1,···,λmlm)=def(aij)p×m.

其中,步骤(6)中所述的“计算因子分析模型中特殊因子的方差矩阵和数据变量的共同度”,其含义说明如下:因子分析模型中特殊因子的方差为:σi2=1-Σt=1mait2,(i=1,2,...,p),变量xi的共同度hi2估计为hi2=Σt=1mait2,(i=1,2,...,p).

其中,步骤(7)中所述的“计算基于方差最大的因子载荷旋转矩阵”,其含义说明如下:对公共因子做正交旋转就是对载荷矩阵A作正交变换,右乘正交矩阵Г,使得AΓ具有更鲜明的意义,旋转后的公共因子向量为F*=Г′F,它的各个分量也是互不相关的公共因子;根据正交矩阵Г的不同选取方式,将构造出不同的正交旋转方法,本发明中采用的方法是最大方差的旋转方法;具体实现过程如下:

A*==(aij*)p×m,dij=aij*/hi,dj=1pΣi=1pdij2,则A*的第j列元素平方的相对方差可以定义为:Vj=1pΣi=1p(dij2-dj)2,式中,取是为了消除dij符号不同的影响;用除以hi是为了消除各个原始变量Xi对公共因子依赖程度不同的影响;最大方差旋转方法就是选择正交矩阵Г,使A*所有m列元素平方的相对方差V达到最大:V=V1+V2+…+Vm;逐次对每两个公共因子进行上述旋转,对公共因子Fl和Fk旋转,就是对A矩阵的第1列和第k列进行正交变换,使这两列的元素平方的相对方差之和最大,而其余列不变,旋转矩阵Гlk可以表示为:

式中,θ是Fl和Fk的旋转角度,矩阵其余元素为0;求θ使V达到最大,由微积分中求极值的方法,将V对θ求导,并令其为0:

V=V1+V2+···+Vm=1pΣi=1p(di12-d1)2+···+1pΣi=1p(dim2-dm)2

所以,由Vθ=0,得:tan4θ=M-2UV/pW-(U2-V2)/p,式中:U=Σi=1pui,V=Σi=1pvi,W=Σi=1p(ui2-vi2),M=2Σi=1puivi,ui=(ai1hi)2+(ai2hi)2,vi=2ai1ai2hi2,ai1、at2是因子载荷矩阵中的元素,hi2是变量xi的共同度。

第一轮旋转后的因子载荷矩阵为A(1),然后开始下一轮的旋转,得到一系列的因子载荷矩阵为:A(1),A(2),...,A(s),...,则必有:V(1)≤V(2)≤...≤V(s)≤...,V(s)为A(s)各列元素平方的相对方差之和,实际应用中,当V(s-1)-V(s)≤ε时,即可停止旋转。

其中,步骤(8)中所述的“利用基于加权最小二乘方法计算因子得分”,其含义说明如下:在得到A和D的基础上,采用加权最小二乘对F进行求解:F^=(A^D^-1A^)-1AD-1X,即得到了F的加权最小二乘估计,式中,是估计得到的因子载荷矩阵,是估计得到的特殊因子方差矩阵,X是读入数据。

其中,步骤(9)中所述的“得到表征高光谱数据的本征维数,实现高光谱数据降维”,其含义说明如下:利用因子得分估计即可得到表征高光谱数据的本征维数,从而实现了高光谱数据降维。

本发明与现有技术相比的优点在于:克服了现有高光谱数据降维方法损失数据信息、无法保留数据原有特性等局限,本方法利用了因子分析模型,并采用了基于方差最大的因子矩阵的正交旋转,得到了表征高光谱数据的本征维数,实现了高光谱数据降维。它具有以下的优点:(1)利用因子分析模型对高光谱数据进行建模求得反映高光谱数据结构与特征的本征维数,消除波段间的相关性的同时简化了数据结构,较好的保持了数据原有特性;(2)利用了基于方差最大的因子载荷旋转,易于各个因子所代表含义的解释,且每种地物只在一个因子中起主导作用,最大程度的增大了不同类型地物之间的可分性。

附图说明

图1为本发明涉及的一种基于因子分析模型的高光谱数据降维方法的实现流程

具体实施方式

为了更好的说明本发明涉及的基于因子分析模型的高光谱数据降维方法,利用PHI航空高光谱数据进行江苏方麓茶场地区农作物精细分类。本发明一种基于因子分析模型的高光谱数据降维方法,实现流程如图1所示,具体实现步骤如下:

(1)高光谱数据的读入:读入方麓茶场PHI高光谱数据,去掉信噪比低、大气吸收等波段,原数据大小为210×150×64;

(2)建立高光谱数据降维的因子分析模型;

高光谱数据降维的因子分析模型为:

X=μ+AF+ε

式中,X=(x1,x2,...,x64)′是可观测的随机变量,均值μ=E(X),X的公共因子F=(F1,F2,...,Fm)′(m<64)是不可观测的随机变量,且满足均值E(F)=0、方差D(F)=Im(即F各个分量方差为1且互不相关),特殊因子ε=(ε1,ε2,...,ε64)′与F互不相关,且满足均值E(ε)=0、方差D(ϵ)=diag(σ12,σ22,...,σ642)=defD;公共因子一般对X每一个分量都起作用,而特殊因子只对X的某一分量起作用,而且特殊因子之间以及特殊因子与公共因子之间互不相关;矩阵A=(aij)p×m是待估计的系数矩阵,称为因子载荷矩阵,在因子分析中,特殊因子起残差或噪声的作用;

(3)计算高光谱数据的均值、协方差矩阵以及相关矩阵;

210×150×64的高光谱数据均值X、协方差矩阵V、相关矩阵R的计算方法如下:

X=1nΣt=1nX(t)=(x1,x2,...,x64)

V=1nΣt=1n(X(t)-X)(X(t)-X)=defVij

R=(rij)=(VijViiVjj);(i,j=1,2,...,64)

式中,X为数据的均值;V为协方差矩阵;R为相关矩阵;n=210×150表示像元数目;X(t)表示第t个像元。

(4)计算数据相关矩阵的特征值和标准化特征向量;

计算相关矩阵R的特征值为λ1≥λ2≥…≥λ64≥0,对应的经施密特正交化后的特征向量为l1,l2,…,l64

(5)由主成分解方法进行因子载荷矩阵的求解;

首先根据λ1+λ2+···+λmλ1+···+λm+···λ640.9的最小整数确定公共因子个数m=6;

然后利用主成分解的方法求解因子载荷矩阵:利用步骤(4)中计算得到的相关矩阵R的特征值为λ1≥λ2≥…≥λ64≥0,对应的经施密特正交化后的特征向量为l1,l2,…,l64,则利用相关矩阵R的谱分解:R=Σi=164λilili,得到因子分析模型的一个解,A=(λ1l1,···,λ6l6)=def(aij)64×6;

(6)计算因子分析模型中特殊因子的方差矩阵和数据变量的共同度;

因子分析模型中特殊因子的方差为:σi2=1-Σt=1mait2,(i=1,2,...,64),变量xi的共同度hi2估计为hi2=Σt=1mait2,(i=1,2,...,64);

(7)计算基于方差最大的因子载荷旋转矩阵;

对公共因子做正交旋转就是对载荷矩阵A作正交变换,右乘正交矩阵Γ,使得AΓ具有更鲜明的意义,旋转后的公共因子向量为F*=Г′F,它的各个分量也是互不相关的公共因子;根据正交矩阵Г的不同选取方式,将构造出不同的正交旋转方法,本发明中采用的方法是最大方差的旋转方法;具体实现过程如下:

A*==(aij*)64×6,dij=aij*/hi,dj=164Σi=164dij2,则A*的第j列元素平方的相对方差可以定义为:Vj=164Σi=164(dij2-dj)2,式中,取是为了消除dij符号不同的影响;用除以hi是为了消除各个原始变量Xi对公共因子依赖程度不同的影响;选择除以hi是因为A*的第i行平方和:

hi*2=Σj=164aij*2=(ai1*,ai2*,...,ai64*)ai1*ai2*···ai64*=(ai1,ai2,...,ai64)ΓΓai1ai2···ai64=Σj=164aij2=hi2

最大方差旋转方法就是选择正交矩阵Г,使A*所有6列元素平方的相对方差V达到最大:V=V1+V2+…+V6;逐次对每两个公共因子进行上述旋转,对公共因子Fl和Fk旋转,就是对A矩阵的第1列和第k列进行正交变换,使这两列的元素平方的相对方差之和最大,而其余列不变,旋转矩阵Гlk可以表示为:

式中,θ是Fl和Fk的旋转角度,矩阵其余元素为0;求θ使V达到最大,由微积分中求极值的方法,将V对θ求导,并令其为0:

V=V1+V2+···+V6=164Σi=164(di12-d1)2+···+164Σi=164(di62-d6)2

所以,由Vθ=0,得:tan4θ=M-2UV/64W-(U2-V2)/64,式中:U=Σi=164ui,V=Σi=164vi,W=Σi=164(ui2-vi2),M=2Σi=164uivi,ui=(ai1hi)2+(ai2hi)2,vi=2ai1ai2hi2,at1、ai2是因子载荷矩阵中的元素,hi2是变量xi的共同度。

第一轮旋转后的因子载荷矩阵为A(1),然后开始下一轮的旋转,得到一系列的因子载荷矩阵为:A(1),A(2),...,A(s),...,则必有:V(1)≤V(2)≤...≤V(s)≤...,V(s)为A(s)各列元素平方的相对方差之和,实际应用中,当V(s-1)-V(s)≤ε(本发明中ε≤0.001)时,即可停止旋转;

(8)利用基于加权最小二乘方法计算因子得分;

在得到因子载荷矩阵A和特殊因子方差矩阵D的基础上,采用加权最小二乘对F进行求解:

F^=(A^D^-1A^)-1AD-1X,

即得到了F的加权最小二乘估计;

(9)得到表征高光谱数据的本征维数,实现高光谱数据降维。

利用因子得分估计即可得到表征高光谱数据的本征维数,从而实现高光谱数据降维;得到了6个表征所使用高光谱数据的所有信息的本征波段。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号