技术领域
本发明属于模式分类领域,特别涉及一种基于模糊优化最小最大神经网络的模式分类方法。
背景技术
模式分类是通过构造一个分类函数或者分类模型将数据集映射到某一个给定的类别中,它是模式识别的核心研究内容,关系到其识别的整体效率,广泛应用于各个研究领域。
目前,基于神经网络的分类方法是模式分类领域的重要方法,但是因为神经网络本身所存在的一些限制往往造成分类精度较低。特别地,对于模糊最小最大神经网络而言,超盒扩展过程会通过增加不同类之间的重叠区域而对分类性能造成负面影响,现有的超级盒重叠测试规则无法检测所有重叠区域,这会影响后续的超级盒收缩过程,最终造成了不同类超盒的重叠而造成了模式分离精度低的问题。
发明内容
本发明的目的是为克服上述现有技术存在的缺点和不足,提供一种基于模糊优化最小最大神经网络的模式分类方法。通过在国际标准数据集(Wine、Glass和Parkinson)上测试,和原始的模糊最小最大神经网络算法进行相比,该算法的模式分类精度优于原始算法。
本发明采用的技术方案如下:
一种基于模糊优化最小最大神经网络的模式分类方法,包括以下步骤:
第1步、对国际标准数据集进行预处理,将预处理后的数据集分为模式分类训练数据集和模式分类测试数据集两部分;
第2步、将模式分类训练数据集作为输入模式;
第3步、模型训练第一阶段,执行超盒扩展过程;
第4步、模型训练第一阶段,执行超盒重叠测试;
第5步、模型训练第一阶段,执行超盒收缩过程;
第6步、模型训练第二阶段,执行超盒优化过程;
第7步、对于模式分类测试数据集的数据,作为输入模式,根据构造出的模糊优化最小最大神经网络模型,对输入模式进行识别,并输出模式分类结果。
第1步中所述的对国际标准数据集进行预处理的具体过程:
第1.1步、数值归一化:对数据集中的每条记录进行使用线性函数进行线性变换,使得结果映射在0-1之间;
第1.2步、将数值归一化后的数据集,按5∶5比例进行划分:随机选择50%的数据作为模式分类训练数据集,剩下的50%作为模式分类测试数据集。
第2步中所述的将模式分类训练数据集作为输入模式的具体过程如下:
对于给定的50%的模式分类训练数据集,构成了一个有序对{X
其中X
第3步中所述的执行超盒扩展过程的具体过程如下:
第3.1步、判断是否存在超盒:如果不存在超盒,则根据输入模式新建超盒,如果存在超盒,执行第3.2步;
第3.2步、判断是否存在同类超盒:如果不存在同类超盒,则根据输入模式新建超盒,如果存在同类超盒,执行第3.3步;
第3.3步、计算输入模式对同类超盒的隶属度值,选择隶属度值最大的超盒作为当前获胜超盒:
根据如下公式计算隶属度值:
其中A
第3.4步、判断当前获胜超盒是否满足扩展条件:如果不满足扩展条件,则对该输入模式新建一个超盒,如果满足扩展条件,执行第3.5步;
超盒扩展条件如下:
其中θ∈[0,1]为扩展参数,定义超盒的大小,由用户定义;
第3.5步、超盒扩展:超盒根据如下公式进行扩展:
新的超盒最小点为:
其中
新的超盒最大点为:
其中
第4步中所述的执行超盒重叠测试的具体过程如下:
为了确定超盒扩展过程是否造成了不同类超盒之间的重叠,执行重叠测试检查是否造成了重叠,对于每个维度,至少满足以下4种规则之一,则两个超盒之间存在重叠;在测试重叠时,沿任何维度的最小重叠和维度的索引被保存,以便在执行收缩过程时使用,最初假定δ
第4.1步、重叠测试第1条规则:
如果两个超盒B
其中,δ
第4.2步、重叠测试第2条规则:
如果两个超盒B
第4.3步、重叠测试第3条规则:
如果两个超盒B
第4.4步、重叠测试第4条规则:
如果两个超盒B
第4.5步、判断是否有重叠:
根据如下不等式判断两个不同类超盒之间是否重叠:
δ
如果满足上式,则表示两个不同类超盒之间有重叠,然后令Δ=i,记下重叠的维度,以及令δ
第5步中所述的执行超盒收缩过程的具体过程如下:
在收缩过程中,通过调整重叠超盒n个维度中重叠最小的维度,以保持超盒大小尽可能大,并且最小地影响正在形成的超盒,具体超盒收缩过程如下所示:
第5.1步、超盒收缩第1条规则:
如果两个超盒B
v
则需调整重叠超盒的最小最大点为:
其中,
第5.2步、超盒收缩第2条规则:
如果两个超盒B
v
则需调整重叠超盒的最小最大点为:
其中,
第5.3步、超盒收缩第3条规则:
如果两个超盒B
v
则需调整重叠超盒的最小最大点为:
其中,
第5.4步、超盒收缩第4条规则:
如果两个超盒B
v
则需调整重叠超盒的最小最大点为:
其中,
第5.5步、超盒收缩第5条规则:
如果两个超盒B
v
则需调整重叠超盒的最小最大点为:
其中,
第5.6步、超盒收缩第6条规则:
如果两个超盒B
v
则需调整重叠超盒的最小最大点为:
其中,
第6步中所述的模型训练第二阶段执行超盒优化过程的具体过程如下:
第6.1步、生成初始种群:使用标准粒子群优化算法执行超盒优化过程,以模型训练第一阶段的模型结果,也就是超盒模糊集作为粒子群优化算法初始种群的一个个体,然后在该个体的基础上进行小范围的上下随机浮动生成初始种群中的其他个体;
第6.2步、计算模式分类精度:将模式分类精度作为适应度函数对初始种群中的每个个体进行评价;
第6.3步、更新粒子的速度和位置:
粒子的速度更新公式如下:
v
其中,c
粒子的位置更新公式如下:
x
其中x
第6.4步、处理边界违规:当粒子的某一维度超盒超盒设定的大小范围时,使其等于边界值;
第6.5步、判断是否满足终止条件:如果不满足终止条件,则继续执行第6.3步到第6.4步,否则,输入最终训练出来的最终超盒模糊集,也即模型训练第二阶段的结果。
第7步中所述的输出模式分类结果的具体过程如下:对于模式分类测试数据集的数据,作为输入模式,根据使用两个训练阶段构造出的模糊优化最小最大神经网络模型,对输入模式进行识别,并输出模式分类结果。
本发明的优点和有益效果:
本发明修改了模糊最小最大神经网络学习算法的基本结构,增加了模型训练过程的第二个阶段,即使用标准粒子群算法执行超盒优化过程。在国际标准数据集上测试进行模式分类,结果显示,该发明能有效避免原学习算法存在的过多超盒重叠而造成模式分类精度低的问题,提高了模式分类的精度,具有较强的鲁棒性和分类效果。
附图说明
图1是本发明一种基于模糊优化最小最大神经网络的模式分类方法的算法流程图;
图2是Wine数据集预处理流程图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步的详细说明。
一种基于模糊优化最小最大神经网络的模式分类方法,对国际标准数据集中的Wine、Glass和Parkinson这三个数据集进行训练与测试,但发明中所有的说明过程都以Wine为例,其他两种数据集也做类似操作。
图1对本发明提供的一种基于模糊优化最小最大神经网络的模式分类方法进行了详细步骤说明,本发明提供的方法包括以下步骤:
第1步、对国际标准数据集进行预处理,如图2所示;
第1.1步、数值归一化:对Wine数据集中的178条记录每条记录13个特征,使用线性函数进行线性变换,使得结果映射在0-1之间;
第1.2步、将数值归一化后的数据集,按5:5比例进行划分:随机选择50%的数据作为模式分类训练数据集,剩下的50%作为模式分类测试数据集。
第2步、将模式分类训练数据集作为输入模式;
对于给定的50%的Wine模式分类训练数据集,构成了一个有序对{X
其中X
第3步、执行超盒扩展过程;
第3.1步、判断是否存在超盒:如果不存在超盒,则根据输入模式新建超盒,如果存在超盒,执行第3.2步;
第3.2步、判断是否存在同类超盒:如果不存在同类超盒,则根据输入模式新建超盒,如果存在同类超盒,执行第3.3步;
第3.3步、计算输入模式对同类超盒的隶属度值,选择隶属度值最大的超盒作为当前获胜超盒:
根据如下公式计算Wine模式分类数据集输入模式的隶属度值:
其中A
第3.4步、判断当前获胜超盒是否满足扩展条件:如果不满足扩展条件,则对该输入模式新建一个超盒,如果满足扩展条件,执行第3.5步;
超盒扩展条件如下:
其中θ∈[0,1]为扩展参数,定义超盒的大小,这里设置为0.2;
第3.5步、超盒扩展:超盒根据如下公式进行扩展:
新的超盒最小点为:
其中
新的超盒最大点为:
其中
第4步、执行超盒重叠测试;
为了确定超盒扩展过程是否造成了不同类超盒之间的重叠,执行重叠测试检查是否造成了重叠,对于每个维度,至少满足以下4种规则之一,则两个超盒之间存在重叠;在测试重叠时,沿任何维度的最小重叠和维度的索引被保存,以便在执行收缩过程时使用,最初假定δ
第4.1步、重叠测试第1条规则:
如果两个超盒B
其中,δ
第4.2步、重叠测试第2条规则:
如果两个超盒B
第4.3步、重叠测试第3条规则:
如果两个超盒B
第4.4步、重叠测试第4条规则:
如果两个超盒B
第4.5步、判断是否有重叠:
根据如下不等式判断两个不同类超盒之间是否重叠:
δ
如果满足上式,则表示两个不同类超盒之间有重叠,然后令Δ=i,记下重叠的维度,以及令δ
第5步、执行超盒收缩过程;
在收缩过程中,通过调整重叠超盒13个维度中重叠最小的维度,以保持超盒大小尽可能大,并且最小地影响正在形成的超盒,具体超盒收缩过程如下所示:
第5.1步、超盒收缩第1条规则:
如果两个超盒B
v
则需调整重叠超盒的最小最大点为:
其中,
第5.2步、超盒收缩第2条规则:
如果两个超盒B
v
则需调整重叠超盒的最小最大点为:
其中,
第5.3步、超盒收缩第3条规则:
如果两个超盒B
v
则需调整重叠超盒的最小最大点为:
其中,
第5.4步、超盒收缩第4条规则:
如果两个超盒B
v
则需调整重叠超盒的最小最大点为:
其中,
第5.5步、超盒收缩第5条规则:
如果两个超盒B
v
则需调整重叠超盒的最小最大点为:
其中,
第5.6步、超盒收缩第6条规则:
如果两个超盒B
v
则需调整重叠超盒的最小最大点为:
其中,
第6步、模型训练第二阶段执行超盒优化过程;
第6.1步、生成初始种群:使用标准粒子群优化算法执行超盒优化过程,以模型训练第一阶段的模型结果,也就是超盒模糊集作为粒子群优化算法初始种群的一个个体,然后在该个体的基础上进行±0.02范围的上下随机浮动生成初始种群中的其他个体;
第6.2步、计算模式分类精度:将模式分类精度作为适应度函数对初始种群中的每个个体进行评价;
第6.3步、更新粒子的速度和位置:
粒子的速度更新公式如下:
v
其中,c
粒子的位置更新公式如下:
x
其中x
第6.4步、处理边界违规:当粒子的某一维度超盒超盒设定的大小范围时,使其等于边界值;
第6.5步、判断是否满足终止条件:如果不满足终止条件,则继续执行第6.3步到第6.4步,否则,输入最终训练出来的最终超盒模糊集,也即模型训练第二阶段的结果。
第7步、输出模式分类结果;
对于模式分类测试数据集的数据,作为输入模式,根据使用两个训练阶段构造出的模糊优化最小最大神经网络模型,对输入模式进行识别,并输出模式分类结果。
本发明所提供的方法模糊优化最小最大神经网络(optimized fuzzy min-maxneural network,简称OFMM)的模式识别准确率与原始的模糊最小最大神经网络(fuzzymin-max neural network,简称FMM)方法进行对比。本实验中,采取随机取样的方法采样,50%的数据作为模式识别训练数据,剩下的50%的数据作为模式识别测试数据,种群大小为50,迭代次数为150。实验结果如表7.1所示,实验结果表明,本发明的模式识别准确率优于原始方法。
表7.1.在国际标准数据集上模式分类准确度的比较
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、同等替换、改进等,均应包含在本发明的权利要求范围之内。
机译: 结构化的责任风险参数化和预测系统提供了基于最小化最大优化方法和定量产量模式关联的综合措施及对应方法
机译: 一种具有加权模糊隶属度函数的多层神经网络分类方法及装置
机译: 使用人工神经网络的OCR系统中基于笔划感知最大-最小合并的文本图像处理