法律状态公告日
法律状态信息
法律状态
2014-01-08
未缴年费专利权终止 IPC(主分类):G01N33/00 授权公告日:20120321 终止日期:20121114 申请日:20081114
专利权的终止
2012-03-21
授权
授权
2009-07-08
实质审查的生效
实质审查的生效
2009-05-13
公开
公开
技术领域
本发明涉及一种环境质量评价方法,特别涉及一种采用粗糙集—RBF神经网络复合技术的环境质量评价方法。
背景技术
环境质量的准确评价是环境保护、生态文明建设中的一项首要工作。由于环境质量评价问题涉及到多因素、多参数,因此增加了对其准确评价的难度。环境质量评价中已有的方法包括:综合评判法、灰色集类法、模糊综合评判法等,这些方法因需要设计各评价因子对各级标准隶属函数及各指标的权重,因此,造成评价模式难以通用,而且无法消除人为因素对评价结论的影响,评价结果失之科学性与准确性。
在确定了环境质量评价因子之后,环境质量评价问题就转化为典型的模式识别问题,其过程就是把这些评价因子的监测值与标准值进行比较、分析、判断以后,得出环境质量评价结论。当前,智能信息处理技术为环境质量评价提供了新的方法,如BP神经网络模型、遗传算法、学习自动机等,但以上方法有一个缺点就是:神经网络在学习阶段参数的估计可能会陷入其优化标准函数的一个局部极小,或者因为计算量较大而难以实用。径向基函数(Radial Basis Funtion,简称RBF)神经网络在理论上能解决以上问题。但仅单纯使用RBF神经网络进行环境质量评价时,具有如下不足之处:
(1)用环境质量评价标准作为训练样本,训练样本过少,这就需要使用相关函数在标准级间内插,以构造足够的样本数量。同时,还需将原始数据进行归一化处理。
(2)将环境质量监测数据作为训练样本时,众多的评价因子将会导致训练样本冗余,产生“过配”现象,使网络泛化能力降低,造成网络结构冗余。
发明内容
针对上述现有技术存在的缺陷或不足,本发明的目的在于,提供一种基于粗糙集—RBF神经网络复合技术的环境质量评价方法,用该方法评价环境质量时,不但通用性好,而且解决了单纯使用神经网络容易出现的“局部极小”、“训练样本过少”、“过配”现象等问题。
为了实现上述任务,本发明采取如下的技术解决方案:
一种基于粗糙集—RBF神经网络复合技术的环境质量评价方法,该方法包括如下步骤:
步骤一,确定环境质量评价因子:
依据采集的环境质量监测数据,建立其数据列表,根据环境质量评价要求,选取环境质量评价因子ai,i=1、2、3,…,n;
步骤二,建立环境质量评价粗糙集属性决策表:
把各个监测数据按照环境质量评价标准转化为相应的环境质量级别,构造属性决策表P,其中条件属性集C={a1,a2,......an},决策属性确定为对应的环境质量级别D={Dec},从而把实际环境质量监测数据转化到了粗糙集的知识域,形成属性决策表P;
步骤三,检查并进行粗糙集属性值约简:
1)检查属性决策表P中有无相同行,若有,则进行合并;
2)检查属性决策表P中有无相冲突的行,若有,则进行删除;
3)检查完成后,生成环境质量级别知识表达系统S,该知识表达系统包括有条件属性集C和决策属性D;
步骤四,进行粗糙集知识系统属性约简:
输入环境质量级别知识表达系统S,根据粗糙集最佳约简算法,按如下方式进行:
1)计算决策属性D的条件属性集C正域posC(D);
2)从条件属性集C中剔除属性ai,Ct=C-ai,其中,i=1、2、3,…,n;
3)计算D的Ct正域posC(D);
4)若
按以上1)~4)步骤遍历所有条件属性,然后输出条件属性集C对于决策属性D的一个相对约简的环境质量级别知识表达系统;
步骤五,规则提取,创建RBF网络:
把约简后的环境质量级别知识表达系统再转化为实际环境质量监测数据,并以其作为RBF神经网络的训练样本集,使用MATLAB工具箱中的newrb函数创建RBF网络进行训练,训练好的RBF网络用于环境质量评价。
其中训练参数设置如下:
训练精度为0.0001,径向基网络隐层的散布常数为0.09~0.15。
本发明首次将粗糙集—RBF神经网络复合技术应用于环境质量评价中,所带来的技术效果是:
(1)由于采用了人工神经网络技术,它可以逼近任何非线性函数,具有很强的自适应、自学习、联想记忆和并行处理能力。将其应用于环境质量评价可避免传统评价方法中人为设定、计算各评价因子对各级标准隶属函数及各指标的权重等,从而解决了传统环境质量评价方法中评价模式难以通用以及人为因素对评价结论的影响等问题;
(2)由于采用了人工神经网络技术中的RBF网络,使用局部激励函数的RBF网络对于每个输入值,只有很少几个节点具有非零激励值,因此只需改变部分的节点及权值,整个网络训练速度快,适应性强,并且其收敛性也较BP网络更好,从而避免了BP网络中容易出现的“陷入局部极小”问题;
(3)依据粗糙集理论构建环境质量级别知识表达系统,对环境质量监测数据进行属性约简,以约简规则集作为RBF神经网路的训练样本,该训练样本包含了监测数据的基本特征,解决了“训练样本过少”的问题;
(4)使用粗糙集理论对环境质量评价中冗余的评价因子进行属性约简,以约简规则集作为RBF神经网路的训练样本,减少了网络拓扑中的输入维数和隐层神经元个数,简化了网络结构,避免了神经网络中的“过配”现象;
(5)本发明使用newrb函数创建RBF网络,减少了RBF神经网路的训练时间。
附图说明
图1为本发明的复合算法流程图。
图2、图3为实施例一和实施例二的网络训练误差图。
下面结合附图和实施例对本发明作进一步详细说明。
具体实施方式
参见图1复合算法流程图,按照上述技术方案,本发明的基于粗糙集—RBF神经网络复合技术的环境质量评价方法包括如下步骤:
步骤一,确定环境质量评价因子:
依据采集的环境质量监测数据,建立其数据列表,根据环境质量评价要求,选取环境质量评价因子ai,i=1、2、3,…,n;
步骤二,建立环境质量评价粗糙集属性决策表:
把各个监测数据按照环境质量评价标准转化为相应的环境质量级别,构造属性决策表P,其中条件属性集C={a1,a2,......an},决策属性确定为对应的环境质量级别D={Dec},从而把实际环境质量监测数据转化到了粗糙集的知识域,形成属性决策表P;
步骤三,检查并进行粗糙集属性值约简:
1)检查属性决策表P中有无相同行,若有,则进行合并;
2)检查属性决策表P中有无相冲突的行,若有,则进行删除;
3)检查完成后,生成环境质量级别知识表达系统S,该知识表达系统包括有条件属性集C和决策属性D;
步骤四,进行粗糙集知识系统属性约简:
输入环境质量级别知识表达系统S,根据粗糙集最佳约简算法,按如下方式进行:
1)计算决策属性D的条件属性集C正域posC(D);
2)从条件属性集C中剔除属性ai,Ct=C-ai,其中,i=1、2、3,…,n;
3)计算D的Ct正域posC(D);
4)若
按以上1)~4)步骤遍历所有条件属性,然后输出条件属性集C对于决策属性D的一个相对约简的环境质量级别知识表达系统;
步骤五,规则提取,创建RBF网络:
把约简后的环境质量级别知识表达系统再转化为实际环境质量监测数据,并以其作为RBF神经网络的训练样本集,使用MATLAB工具箱中的newrb函数创建RBF网络进行训练,训练好的RBF网络用于环境质量评价。其中训练参数设置如下:训练精度为0.0001,径向基网络隐层的散布常数为0.09~0.15。
以下是发明人给出的具体实施例,需要说明的是,本发明不限于这些实施例,本发明的方法还适用于对声学环境质量、土壤环境质量和生态环境质量等进行评价。
实施例1:长江某水系2002年的水环境质量评价
1、确定环境质量评价因子
选取如表1所示长江某水系2002年的监测数据,包括5个评价因子:总氮(TN)、氨氮(NH3-N)、总磷(TP)、高锰酸盐指数(CODMn)以及总铅,另外还有监测数据的综合指数法评价结果。
表1:水环境质量监测数据
根据《地表水环境质量标准》GB3838-2002,如表2所示:
表2 地表水质量评价标准(mg/L)
2、建立环境质量评价粗糙集属性决策表
根据表2的评价标准,将表1中的14个采样点的监测数据转化为相应的水质级别。同时,在表1中,用a1、a2、a3、a4、a5分别代表TN、NH3-N、TP、CODMn、总铅五个评价因子,用Dec代表综合指数法评价结果,即论域U={1,2,...,14}表示采样点,条件属性C={a1,a2,a3,a4,a5},决策属性D={Dec}。形成属性决策表P,结果如表3所示。
表3 属性决策表P
3、检查并进行粗糙集属性值约简
从表3可以看出,采样点1和12的水质级别相同,将其合并;采样点2、4、5、6、8、9以及11水质级别相同,将其合并。如果有相冲突的行,即条件属性相同,而决策属性不同,将其删除。这样就得到如表4所示的水质级别知识表达系S:
表4 水质级别知识表达系统S
4、进行粗糙集知识系统属性约简
根据粗糙集最佳约简算法,对水质级别知识表达系统进行属性约简。每次去掉一个条件属性ai,检查D在C={ai}的正域是否等于D在C的正域,如相等,则为冗余属性,删除之。以a1为例,判断属性a1是否为冗余属性:
U/C={{1},{2},{3},{4},{5},{6},{7}};
U/D={{1,2,4,5,6},{3},{7}};
posC(D)={{1},{2},{3},{4},{5},{6},{7}};
U/(C={a1})={{1,6},{2,3,5},{4},{7}};
所以,a1是Dec不可省略的,不能删除。依次类推,经计算表4中a4、a5是可省略的,删除后,得到属性约简后的水质级别知识表达系统,如表5所示。
表5 约简后的水质级别知识表达系统
5、规则提取,创建RBF网络
根据约简结果,以约简后的水质级别知识表达系统中的7组数据作为RBF网络的输入。而针对网络的输出,考虑到水质级别评价包括1、2、3、4、5共5个级别,即5种模式,因此采用0-1的形式来表示输出,见表6。
表6:RBF网络的输入输出模式
如果在设计中,使用newrb函数创建RBF网络,设计参数为:训练精度为0.001、径向基网络隐层的散布常数为0.1。当隐层径向基神经元个数增加到4时,网络达到了期望的误差值,如图2所示。
6、系统测试
以表7中的数据为测试数据,对训练好的RBF网络进行测试,并给出传统综合指数法的评价结果,以作对比。
表7 测试数据
测试结果为:Y=
采样点1 采样点2 采样点3 采样点4 采样点5
0.0000 0.0000 0.0000 0.0000 0.8877
1.0000 1.0000 1.0000 1.0000 0.1123
1.0000 1.0000 1.0000 1.0000 1.0340
在上述的测试结果中,每一列数据代表一个采样点的水质级别。结合步骤5中的规定,以0.5为0和1的分界点,比如,采样点1对应的测试结果为011,这与步骤5中规定的III级水质级别一致,所以判断采样点1的水质级别为III级。依次类推,将测试结果逐个转换,并与传统综合指数法评价结果对比,发现该方法水环境质量评价的准确性完全可以满足水质评价的实际要求。
实施例2:陕西省西安市空气环境质量评价
1、确定环境质量评价因子
选取如表8所示陕西省西安市空气环境2006年的监测数据,包括7个评价因子:总悬浮颗粒物(TSP)、二氧化硫(SO2)、氮氧化物(NOX)、二氧化氮(NO2)、飘尘(PM10)、一氧化碳(CO)以及臭氧(O3),另外还有监测数据的综合指数法评价结果。
表8:空气环境质量监测数据
根据空气质量评价标准,如表9所示:
表9:空气质量评价标准(mg/L)
2、建立环境质量评价粗糙集属性决策表
根据表9的评价标准浓度限值,将表8中的10个采样点的监测数据转化为相应的空气质量级别。同时,在表8中,用a1、a2、a3、a4、a5、a6、a7分别代表TSP、SO2、NOX、NO2、PM10、CO、O3七个评价因子,用Dec代表综合指数法评价结果,即论域U={1,2,3......10}表示采样点,条件属性C={a1,a2,a3,a4,a5,a6,a7},决策属性D={Dec}。
形成属性决策表P,结果如表10所示。
表10:属性决策表P
3、检查并进行粗糙集属性值约简
从表10以看出,采样点1、2、6和7的空气质量级别相同,将其合并。如果有相冲突的行,即条件属性相同,而决策属性不同,将其删除。这样就得到如表11所示的空气质量级别知识表达系统S:
表11:空气质量级别知识表达系统S
4、进行粗糙集知识系统属性约简
根据粗糙集最佳约简算法,对空气质量级别知识表达系统进行属性约简,每次去掉一个条件属性ai,检查D在C={ai}的正域是否等于D在C的正域,如相等,则为冗余属性,删除之。以a1为例,判断属性a1是否为冗余属性:
U/C={{1},{2},{3},{4},{5},{6},{7}};
U/D={{1,2,3,4},{5,7},{6}};
posC(D)={{1},{2},{3},{4},{5},{6},{7}};
U/(C={a1})={{1,4},{2},{3},{5,7},{6}};
所以,a1是Dec不可省略的,不能删除。依次类推,经计算,表11中的a3、a6、a7是可省略的,删除后,得到属性约简后的空气质量级别知识表达系统,如表12所示。
表12:约简后的空气质量级别知识表达系统
5、规则提取,创建RBF网络
根据约简结果,以约简后的空气质量级别知识表达系统中的7组数据作为RBF网络的输入。而针对网络的输出,考虑到空气质量级别评价包括I、II、III1、III2、IV1、IV2、V共7个级别,即7种模式,因此采用0-1的形式来表示输出,见表13。
表13:RBF网络的输入输出模式
在设计中,使用newrb函数创建RBF网络,设计参数为:训练精度为0.001、径向基网络隐层的散布常数为0.15。当隐层径向基神经元个数增加到6时,网络达到了期望的误差值,如图3所示。
6、系统测试
以表14中的数据为测试数据,对训练好的RBF网络进行测试,并给出传统综合指数法的评价结果,以作对比。
表14:测试数据
测试结果为:Y=
采样点1 采样点2 采样点3 采样点4 采样点5
0.0081 0.8845 0.0787 0.9376 0.1006
1.0081 0.1155 0.9213 0.2624 0.8994
0.1634 0.1470 0.0318 0.1919 0.9870
在上述的测试结果中,每一列数据代表一个采样点的空气质量级别。结合步骤5中的规定,以0.5为0和1的分界点,比如,采样点1对应的测试结果为010,这与步骤5中规定的II级空气质量级别一致,所以判断采样点1的空气质量级别为II级。依次类推,将测试结果逐个转换,并与传统综合指数法评价结果对比,发现该方法空气环境质量评价的准确性完全可以满足空气质量评价的实际要求。
本发明方法还适用于对声学环境质量、土壤环境质量和生态环境质量等进行评价,评价模式通用性好,解决了单纯使用神经网络容易出现的“局部极小”、“训练样本过少”、“过配”现象等问题。
机译: 室内环境质量综合评价方法
机译: 室内环境质量综合评价方法
机译: 室内环境质量综合评价方法