首页> 中国专利> 基于深度特征与多核Boosting学习相结合的害虫图像识别方法

基于深度特征与多核Boosting学习相结合的害虫图像识别方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及基于深度特征与多核Boosting学习相结合的害虫图像识别方法，与现有技术相比解决了害虫图像识别率低的缺陷。本发明包括以下步骤：获取自然图像集；害虫图像的收集、标记和预处理；利用训练集的样本形成块级特征；利用多核Boosting学习的SVM训练多核分类框架；将测试集的样本形成块级特征后，输入训练完成后的多核分类框架中，进行害虫图像的自动识别。本发明利用了害虫图像的多层深度特征并与多核Boosting学习相结合进行害虫的图像识别，提高了害虫识别的准确率。

著录项

公开/公告号CN107025431A

专利类型发明专利
公开/公告日2017-08-08

原文格式PDF
申请/专利权人中国科学院合肥物质科学研究院;
展开▼

申请/专利号CN201710105763.6
发明设计人陈天娇;谢成军;余健;张洁;李瑞;陈红波;王儒敬;宋良图;
展开▼

申请日2017-02-24
分类号
代理机构合肥国和专利代理事务所(普通合伙);
代理人张祥骞
地址 230031 安徽省合肥市蜀山湖路350号
入库时间 2023-06-19 02:58:05

法律信息

法律状态公告日

法律状态信息

法律状态
2019-06-18

授权

授权
2017-09-01

实质审查的生效 IPC(主分类):G06K9/00 申请日:20170224

实质审查的生效
2017-08-08

公开

公开

说明书

技术领域

本发明涉及图像识别技术领域，具体来说是基于深度特征与多核 Boosting学习相结合的害虫图像识别方法。

背景技术

害虫一直是困扰农作物生长的基本问题，由于植物害虫症状最初很模糊，加大了人工目测的难度。害虫图像的识别由于其植物种类的多样性、不同种类植物害虫的多变性，使得传统的自动识别方法识别率不高、鲁棒性较差，且只能存在于实验阶段。因此，如何能够提高害虫图像识别的准确性已经成为急需解决的技术问题。

发明内容

本发明的目的是为了解决现有技术中害虫图像识别率低的缺陷，提供一种基于深度特征与多核Boosting学习相结合的害虫图像识别方法来解决上述问题。

为了实现上述目的，本发明的技术方案如下：

一种基于深度特征与多核Boosting学习相结合的害虫图像识别方法，包括以下步骤：

获取自然图像集，获取自然图像集并分割成自然图像块，使用无监督特征学习方法从未标记的自然图像块中训练学习字典；

害虫图像的收集、标记和预处理，对所有害虫图像均在照明均匀的条件下拍摄，并将拍摄聚焦在害虫症状上，将所有害虫图像归一化并缩放到大小为 200×200像素，得到若干个样本；将每种害虫的样本随机分成训练集和测试集；

利用训练集的样本形成块级特征，将已标记的训练图像从不同尺度上提取图像块，将某尺度下的训练图像块集通过学习字典进行稀疏表示后，再通过空间对齐池化操作形成块级特征；

利用多核Boosting学习的SVM训练多核分类框架，将不同尺度下的块级特征通过基于多核Boosting学习的支持向量机训练多核分类框架；

将测试集的样本形成块级特征后，输入训练完成后的多核分类框架中，进行害虫图像的自动识别。

所述的获取自然图像包括以下步骤：

获取自然图像集Y，Y＝[y₁,y₂,...y_i,...]，y_i表示第i张自然图像；利用均匀网格从自然图像集中共提取出N个自然图像块x_i，x_i∈Rⁿ,(i＝1,2,...,N)，其中每一张自然图像提取K块，并对自然图像块x_i均做归一化处理；

应用奇异值分解算法训练学习字典，求解如下优化问题获得学习字典：

D＝[d₁,d₂,...,d_M]∈R^n×M表示学习字典，是自然图像块x_i对应的稀疏编码，是自然图像块x_i的稀疏表示向量。

所述的利用训练集的样本形成块级特征包括以下步骤：

将已标记的训练图像从不同尺度上提取图像块，从粗粒度水平、中粒度水平和细粒度水平不同尺度上分别对训练图像提取图像块；

对于一张训练图像y_i，利用某一个尺度大小的均匀网格分割得到K个害虫图像块[x₁,x₂,...,x_K]；

将某尺度下的训练图像块通过学习字典进行稀疏表示；

利用字典将图像块稀疏编码包括以下步骤：

对于给定的害虫图像y_i，使用均匀网格把图像分割成重叠方块>1,x₂,...,x_K]∈R^n×K；

利用奇异值分解算法学习得到学习字典D，K个害虫图像块[x₁,x₂,...,x_K]对应的稀疏编码分别为找到每个块x_i的稀疏代码解决下面的优化问题，

其中||·||₀是中非零元素的数目；

采取l₁范数最小化替代，解决下面的优化问题：

其中的解是对应的局部图像块向量x_i对应的特征向量，对应于一张害虫图像中所有的局部图像块的稀疏编码；

通过空间对齐池化操作形成块级特征，其包括以下步骤：

第i个块的稀疏编码被划分成J段，其中表示系数的第j段；

然后进行加权，其公式如下：

其中，矢量v_i对应于第i个局部块；

一张训练图像对应的所有局部块分别对应的特征向量v_i形成矩阵V；

对矩阵V做池化操作，取矩阵V的对角元素产生最终的块级特征，其公式如下：

s＝diag(V),

其中：s表示从一张训练图像某一尺度上提取的特征向量。

所述的利用多核Boosting学习的SVM训练多核分类框架包括以下步骤：

在SVM中输入训练集不同尺度的特征集{f₁,f₂,...f_N}、核矩阵>1,K₂,...K_M}、初始化强分类器F(x)＝0，

其中，x_i表示训练样本、y_i表示训练样本的标记、D表示训练样本数；

对于每一个n∈N、m∈M训练每一个包括f_N和K_M相对应的单个SVM_mn的参数a_mn和b_mn，

h_mn＝K_mn(x,x_i)^Ta_mn+b_mn；

初始化样本权重将训练样本赋值相同的初始权重；在每一次迭代中，选择数据集中分类误差最小的SVM分类器；

设迭代次数l＝1至L；

对于每一个支持向量机计算其分类误差ε_m,n，

其中U(x)是一个函数，当x＞0为1，否则为-1；

选择h_l(x)＝argminε_mn；

计算选择SVM分类器的权重

如果β₁＜0则该迭代终止；否则更新决策函数F(x)←β_lh_l,将选取的分类器加入到决策函数中；

用更新训练样本的权重,在下次迭代中将分类错误的样本赋更大的权重值；

分类器为输出由多个单核SVM分类器组成的强分类器。

有益效果

本发明的基于深度特征与多核Boosting学习相结合的方法，与现有技术相比利用了害虫图像的多层深度特征并与多核Boosting学习相结合进行害虫的图像识别，提高了害虫识别的准确率，增强了害虫识别算法的鲁棒性。

附图说明

图1为本发明的方法顺序图。

具体实施方式

为使对本发明的结构特征及所达成的功效有更进一步的了解与认识，用以较佳的实施例及附图配合详细的说明，说明如下：

如图1所示，本发明所述的一种基于深度特征与多核Boosting学习相结合的害虫图像识别方法，包括以下步骤：

第一步，获取自然图像集。获取自然图像集并分割成自然图像块，使用无监督特征学习方法从未标记的自然图像块中训练学习字典。其具体步骤如下：

(1)获取自然图像集Y，Y＝[y₁,y₂,...y_i,...]，y_i表示第i张自然图像。

利用均匀网格从自然图像集中共提取出N个自然图像块x_i，>i∈Rⁿ,(i＝1,2,...,N)，其中每一张自然图像提取K块，并对自然图像块x_i均做归一化处理，即一张自然图像分成K块、多张自然图像被分成多个K块，其总数为N个。

(2)应用非监督学习算法奇异值分解算法训练学习字典，求解如下优化问题获得学习字典：

D＝[d₁,d₂,...,d_M]∈R^n×M表示学习字典，是自然图像块x_i对应的稀疏编码，是自然图像块x_i的稀疏表示向量。

第二步，害虫图像的收集、标记和预处理。对所有害虫图像均在照明均匀的条件下拍摄，以消除照明变化对分类性能的潜在负面影响，并将拍摄聚焦在害虫症状上。出于计算效率考虑，将所有害虫图像归一化并缩放到大小为 200×200像素，得到若干个样本；将每种害虫的样本随机分成训练集和测试集。

第三步，利用训练集的样本形成块级特征。将已标记的训练图像从不同尺度上提取图像块，将某尺度下的训练图像块集通过学习字典进行稀疏表示后，再通过空间对齐池化操作形成块级特征。

当害虫图像经历大的外观变化时，相对较小的尺度，较大的图像块水平可以提供更好的几何特征，而较小的图像块可获得更精细的特征。为了获得害虫图像的更紧凑的表示，在此从不同尺度上对图像进行采样：粗粒度水平，中粒度水平和细粒度水平。每个尺度的图像块大小不一样，其范围例如为3×3、 5×5、7×7。将已标记的训练害虫图像通过不同尺度下的均匀网格分割成重叠方块，将图像块利用已学习的字典稀疏编码，为了保留重要的特征信息去除不相干的冗余信息，再通过空间对齐池化形成块级特征。其具体步骤如下：

(1)将已标记的训练图像从不同尺度上提取图像块，从粗粒度水平、中粒度水平和细粒度水平不同尺度上分别对训练图像提取图像块，即从3个不同尺度上均对训练图像进行采样，最终形成3个不同尺度的多个特征向量s，从而组成不同尺度的特征集{f₁,f₂,...fN}。

对于一张训练图像y_i，利用某一个尺度(粗粒度水平、中粒度水平或细粒度水平)大小的均匀网格分割得到K个害虫图像块[x₁,x₂,...,x_K]。

(2)将某尺度下的训练图像块通过学习字典进行稀疏表示；

利用字典将图像块稀疏编码包括以下步骤：

A、对于给定的害虫图像y_i，使用均匀网格把图像分割成重叠方块>1,x₂,...,x_K]∈R^n×K；

B、利用奇异值分解算法学习得到学习字典D，K个害虫图像块[x₁,x₂,...,x_K]>i的稀疏代码解决下面的优化问题，

其中||·||₀是中非零元素的数目；

因为l₀范数最小化是NP难的问题，因此采取l₁范数最小化，解决下面的优化问题：

其中的解是对应的局部图像块向量x_i对应的特征向量，对应于一张害虫图像中所有的局部图像块的稀疏编码。

(3)通过空间对齐池化操作形成块级特征，其包括以下步骤：

A、第i个块的稀疏编码被划分成J段，其中表示系数的第j段；

B、然后进行加权，其公式如下：

其中，矢量v_i对应于第i个局部块；

一张训练图像对应的所有局部块分别对应的特征向量v_i形成矩阵V；

C、对矩阵V做池化操作，取矩阵V的对角元素产生最终的块级特征，其公式如下：

s＝diag(V),

其中：s表示从一张训练图像某一尺度上提取的特征向量。

第四步，利用多核Boosting学习的SVM训练多核分类框架，将不同尺度下的块级特征通过基于多核Boosting学习的支持向量机训练多核分类框架。在完成害虫图像不同尺度深度块级特征提取后，利用多核Boosting学习分类方法来实现害虫图像的训练，为了融合不同尺度的深度特征，通过联合多个核函数方式完成不同特征下权值的自适应学习。其具体步骤如下：

(1)在SVM中输入训练集不同尺度的特征集{f₁,f₂,...f_N}、常用的核矩阵{K₁,K₂,...K_M}、初始化强分类器F(x)＝0，其中，x_i表示训练样本、y_i表示训练样本的标记、D表示训练样本数。

(2)对于每一个n∈N、m∈M训练每一个包括f_N和K_M相对应的单个SVM_mn的参数a_mn和b_mn，

h_mn＝K_mn(x,x_i)^Ta_mn+b_mn。

(3)初始化样本权重将训练样本赋值相同的初始权重；在每一次迭代中，选择数据集中分类误差最小的SVM分类器；

(4)设迭代次数l＝1至L；

A、对于每一个支持向量机计算其分类误差ε_m,n，

其中U(x)是一个函数，当x＞0为1，否则为-1。

B、选择h_l(x)＝argminε_mn；

C、计算选择SVM分类器的权重

D、如果β_l＜0则该迭代终止；否则更新决策函数F(x)←β_lh_l,将选取的分类器加入到决策函数中；

E、用更新训练样本的权重,在下次迭代中将分类错误的样本赋更大的权重值。

(5)分类器为输出由多个单核SVM分类器组成的强分类器。

第五步，将测试集的样本形成块级特征后，输入训练完成后的多核分类框架中，进行害虫图像的自动识别，识别出待测害虫图像的类别。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是本发明的原理，在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于深度特征与多核Boosting学习相结合的害虫图像识别方法 [P] . 中国专利： CN107025431B . 2019.06.18
2. 基于深度特征与多核Boosting学习相结合的害虫图像识别方法 [P] . 中国专利： CN107025431A . 2017-08-08
3. DEEP LEARNING MODULARIZATION SYSTEM ON BASIS OF WEB PLUG-IN AND IMAGE RECOGNITION METHOD USING SAME [P] . 世界知识产权组织专利： WO2017039086A1 . 2017-03-09

机译：基于Web Plug-in的深度学习调制系统和基于相同方法的图像识别方法
4. The language recognition method and system for the disabled based on combination of sensor and image recognition technology [P] . 英国专利： GB201521562D0 . 2016-01-20

机译：基于传感器和图像识别技术相结合的残疾人语言识别方法和系统
5. Deep Learning Frame Work-Based Image Recognition Method and System Using Training Image Data [P] . KR20210057845A . 2021-05-24

机译：基于深度学习框架工作的图像识别方法和系统使用训练图像数据