技术领域
本发明涉及模型搜索技术领域,具体而言,涉及一种基于隐马尔可夫模型的目标检测模型的搜索方法。
背景技术
随着人工智能技术的发展,目标检测作为人工智能的一个重要应用,广泛应用于越来越多的领域。比如人脸识别,行人检测,客流统计,安全防范等。与此同时,各种各样的目标检测算法也应用而生,包括SSD,YOLOv3,Faster R-CNN等。面对不同的检测任务,通常需要构造特定网络结构的目标检测模型,而现有的目标检测模型通常存在含带参数量庞大的问题,这样,训练好的目标检测模型在使用中对终端设备的内存和GPU的负荷较大,易导致终端设备执行困难,故而存在实用性差的问题。
发明内容
本发明的主要目的在于提供一种基于隐马尔可夫模型的目标检测模型的搜索方法,以解决现有技术中的目标检测模型因含带参数量庞大,而导致训练好的目标检测模型在使用中对终端设备的内存和GPU的负荷较大,造成终端设备执行困难的问题,故而存在实用性差的问题。
为了实现上述目的,本发明提供了一种基于隐马尔可夫模型的目标检测模型的搜索方法,包括:步骤S1,根据观察序列O、状态转移矩阵A、概率矩阵B以及初始状态分布概率Π建立用于目标检测模型搜索的隐马尔可夫模型,其中,观察序列O包含n个观察量,每个观察量对应指代一个目标检测模型;步骤S2,利用Baum-Welch算法并基于观察序列O,对隐马尔可夫模型的状态转移矩阵A、概率矩阵B以及初始状态分布概率Π进行参数重估,直至隐马尔可夫模型收敛,保存上述各参数值,形成重构隐马尔可夫模型;步骤S3,利用Viterbi算法和重构隐马尔科夫模型预测得到观察序列O
进一步地,目标检测模型的排序得分C根据公式(1)计算获得:
C=k
公式(1)中,R
进一步地,根据排序得分C由小到大对所有目标检测模型重新排序后得到对应的观察序列O
进一步地,预设条件为:目标检测模型Ω
进一步地,在步骤S4中,当观察序列O
进一步地,目标检测模型由前处理网络结构和沙漏网络结构组成,步骤S1包括:
步骤S11,构造隐含状态集合S,其隐含状态数目N为13,隐含状态集合S为{s
进一步地,状态转移矩阵A为{{a
进一步地,状态转移矩阵A为由M个N*N的方阵构成的三维矩阵。
进一步地,隐马尔可夫模型为二维隐马尔可夫模型。
进一步地,在步骤S5中,使用目标图像训练集训练目标检测模型Ω
应用本发明的技术方案,通过重构隐马尔可夫模型搜索获得特定网络结构的目标检测模型,能够有效地减小目标检测模型的尺寸,大幅度缩减目标检测模型的参数量,从而确保目标检测模型能够使用于大部分终端设备,提高了目标检测模型的实用性,利用本发明提供的方法获得的目标检测模型不会给终端设备带来过大的运行负荷,确保了终端设备能够长时间稳定运行,确保目标检测的可靠性。利用上述的搜索方法的步骤搜索得到满足预设条件的目标检测模型,能够实现对目标检测模型的有效压缩,在保证了在利用深度学习使得计算机视觉任务的性能提高的前提下,最大限度地减小了目标检测模型对于计算空间和时间的消耗,克服了高额的存储空间、计算资源消耗在各种终端设备上难于有效应用的问题。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明的一种可选实施例的基于隐马尔可夫模型的目标检测模型的搜索方法的流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”、“和”、“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了解决现有技术中的目标检测模型因含带参数量庞大,而导致训练好的目标检测模型在使用中对终端设备的内存和GPU的负荷较大,造成终端设备执行困难的问题,故而存在实用性差的问题的问题,本发明提供了一种基于隐马尔可夫模型的目标检测模型的搜索方法。当然,本发明还提供了一种存储介质,存储介质为计算机可读存储介质,存储介质上存储有计算机程序指令,其中,程序指令被处理器执行时用于实现上述的基于隐马尔可夫模型的目标检测模型的搜索方法的步骤。本发明还提供了一种电子设备,包括:处理器、存储器、通信元件和通信总线,处理器、存储器和通信元件通过所述通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行如上述的基于隐马尔可夫模型的目标检测模型的搜索方法的步骤。
图1是根据本发明实施例的基于隐马尔可夫模型的目标检测模型的搜索方法的流程图。如图1所示,该目标检测模型的搜索方法包括步骤如下:
步骤S1,根据观察序列O、状态转移矩阵A、概率矩阵B以及初始状态分布概率Π建立用于目标检测模型搜索的隐马尔可夫模型,其中,观察序列O包含n个观察量,每个观察量对应指代一个目标检测模型;步骤S2,利用Baum-Welch算法并基于观察序列O,对隐马尔可夫模型的状态转移矩阵A、概率矩阵B以及初始状态分布概率Π进行参数重估,直至隐马尔可夫模型收敛,保存上述各参数值,形成重构隐马尔可夫模型;步骤S3,利用Viterbi 算法和重构隐马尔科夫模型预测得到观察序列O
通过重构隐马尔可夫模型搜索获得特定网络结构的目标检测模型,能够有效地减小目标检测模型的尺寸,大幅度缩减目标检测模型的参数量,从而确保目标检测模型能够使用于大部分终端设备,提高了目标检测模型的实用性,利用本发明提供的方法获得的目标检测模型不会给终端设备带来过大的运行负荷,确保了终端设备能够长时间稳定运行,确保目标检测的可靠性。利用上述的搜索方法的步骤搜索得到满足预设条件的目标检测模型,能够实现对目标检测模型的有效压缩,在保证了在利用深度学习使得计算机视觉任务的性能提高的前提下,最大限度地减小了目标检测模型对于计算空间和时间的消耗,克服了高额的存储空间、计算资源消耗在各种终端设备上难于有效应用的问题。
需要说明的是,本发明的目标检测模型通过目标检测网络对待测图像进行中心点检测以识别目标对象。目标检测网络由前处理网络结构和沙漏网络结构组成。可选地,前处理网络结构作为目标检测网络的一部分用于浅层特征提取和压缩模型计算量,沙漏网络结构用于深层特征提取。神经网络结构搜索(NAS)即在现有的目标检测网络上搜索出一个含有参数量更少的沙漏网络结构的检测网络,从而经过训练得到的目标检测模型在使用过程中计算量更小。
由于基于沙漏网络结构的目标检测网络所使用的特征提取网络是在开源的coco数据集90类上训练得到,而目标检测模型在实际使用中不需要对重多类别的目标对象进行检测,而是只有几类目标对象需要检测,因此,沙漏网络结构不需要设定庞大的参数量(亿级别),参数量能够控制在低量水平(30万-200万),从而训练好的目标检测模型不会因存在大参数量而导致终端设备执行困难,大大地降低了对终端设备的内存和GPU的负荷。
具体地,步骤S1包括:步骤S11,构造隐含状态集合S,其隐含状态数目N为13,隐含状态集合S为{s
本实施例中,隐含状态s
则构造的隐含状态集合S为:
{(卷积+res)网络结构, 卷积网络结构, res网络结构, 0,8,16,24,32,48,64,80,96,128}。对隐含状态集合S中的每一个隐含状态进行编号,则13个隐含状态分别对应的编号为:0、1、2、3、4、5、6、7、8、9、10、11、12。
观察状态集合V为{v
在一个可选实施例中,构造的观察状态集合V为:
{卷积网络结构,(卷积+res)网络结构, 16,32,48,64,64,64,80,80,128,128},则根据隐含状态集合S中的每一个隐含状态进行编号形成观察序列O的一个观察量,记为:
o
需要说明的是, 将M个N*N的方阵构成状态转移矩阵A,状态转移矩阵A为{{a
需要说明的是,在步骤S2之前,利用对应于初始网络结构的观察量o
其中,1≤j≤N,b
在步骤S6中,目标检测模型的排序得分C根据公式(1)计算获得:
C=k
公式(1)中,R
可选地, k
可选地, 根据排序得分C由小到大对所有目标检测模型重新排序后得到对应的观察序列O
进一步地,预设条件为:目标检测模型Ω
进一步地,在步骤S4中,当观察序列O
优选地,∆ø为0.05。
本发明中,可选地,隐马尔可夫模型为二维隐马尔可夫模型。
还需要说明的是, 在步骤S5中,使用目标图像训练集训练目标检测模型Ω
本发明将基于沙漏网络结构的目标检测模型的网络结构进行编号,排列为变量序列,根据初始模型结构训练初始隐马尔可夫模型,利用初始马尔可夫模型预测后续的模型结构后,利用目标图像训练集训练该模型结构后,在目标图像验证集上获得模型的精度后,根据已有的模型结构的计算量和在验证集上的精度对模型结构排序,利用排序好的模型结构重新训练隐马尔可夫模型后,然后循环上述过程直到得到满足需求的目标检测模型。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
机译: 使用训练数据向量和基于用于描述隐马尔可夫模型的条件参数的最近邻聚类方法训练隐马尔可夫模型
机译: 用于基于隐马尔可夫模型(HMM)的语音识别的最佳最大似然决策树的生成和搜索方法和系统
机译: 基于隐马尔可夫模型的声学模型建立装置和方法