法律状态公告日
法律状态信息
法律状态
2013-07-10
授权
授权
2011-03-23
实质审查的生效 IPC(主分类):G01N33/18 申请日:20100813
实质审查的生效
2011-01-26
公开
公开
技术领域
软测量方法是检测技术及仪表研究的主要发展趋势之一,是先进制造技术领域的重要分支,本发明涉及污水处理过程中出水关键水质指标生化需氧量BOD的软测量方法;软测量是根据某种最优准则,选择一组既与主变量密切联系,又容易测量的辅助变量,通过构造某种数学模型,依靠事先学习和记忆实现对主变量的估计;软测量的精度取决于对实测数据的学习、记忆和联想的效果以及不断进行再学习的能力;将软测量方法应用于污水处理系统,既可节约投资和运行成本,又能及时监测出水水质和相关参数,促使污水处理厂高效稳定运行;因此,BOD的软测量方法在污水处理系统中具有重要意义。
背景技术
国务院在《中华人民共和国国民经济和社会发展第十一个五年规划纲要》中明确提出:加强城市污水处理设施建设,全面开征污水处理费,到2010年城市污水处理率不低于70%。在此背景下,仅2007年全国就新建成城市污水处理厂482座。到2008年末,我国城市污水处理厂日处理能力达8295万立方米,城市污水处理率达到66%。但污水处理厂的运行状况却不容乐观,据国家环保部门统计,运行负荷不足、出水水质超标或运行异常的污水处理厂约占到50%。城市污水处理过程中存在的主要问题是:①电能消耗过大,运行成本居高;②异常工况繁发,出水水质超标现象严重。国家中长期科技发展规划中提出要抑制异常工况发生,确保污水处理质量达标;研究并推广高效、低能耗的污水处理新技术;因此,本发明的研究成果具有广阔的应用前景。
城市污水处理的控制目标就是使出水达到国家排放标准——如GB18918,主要涉及的参数有生化需氧量——BOD、化学需氧量——COD、悬浮物——SS、氨氮——NH3-N、总氮——TN和总磷——TP等。其中水质参数BOD是指在规定时间内分解单位有机物所需要的氧量,目前污水处理厂多通过使用稀释接种法、微生物传感器快速测定法测定不同类型水中生化需氧量BOD,其BOD分析测定周期一般为5天,不能及时反映污水处理实际情况,不能实现对BOD实时测量,直接导致污水处理过程难以实现闭环控制。另外,污水中污染物的数量多、含量各异,对检测是一大挑战。研制新型硬件形式的过程测量仪表,虽然可以直接地解决各种污水处理过程变量及水质参数的检测问题,但由于污水中有机物非常复杂,研发这些传感器将是一个耗资大、历时长的工程。因此,研究新的测量方法解决过程参数的实时测量问题,已成为污水控制工程领域研究的重要课题,并且具有重要的现实意义。
本发明提出一种新的BOD软测量方法,通过构建弹性径向基(以下简称RBF)神经网络模型,利用神经元的活跃度以及神经元间的交互信息分析网络的连接强度,以此判断增加或删除RBF神经网络隐含层神经元,同时调整神经网络的拓扑结构,有效地解决了RBF神经网络结构设计问题,同时利用梯度下降的参数修正算法保证了最终弹性RBF网络的精度,实现了神经网络的结构和参数自校正,实现对污水处理过程中关键参数BOD的间接在线测量。
发明内容
本发明获得了一种基于弹性RBF神经网络的污水处理关键水质参数BOD的软测量方法;该方法通过分析污水处理过程,在众多可测变量中选择一组既与BOD有密切联系又容易测量的变量作为辅助变量,通过构造弹性RBF神经网络,实现辅助变量与BOD之间的映射,实现污水水质BOD的在线测量,解决了当前BOD测量周期长的问题;
本发明采用了如下的技术方案及实现步骤:
1.一种基于弹性RBF神经网络的BOD软测量方法,
(1)设计用于BOD软测量的弹性RBF神经网络初始拓扑结构;网络分为三层:输入层、隐含层、输出层。输入为污水曝气池进水水质指标,输出为出水生化需氧量BOD;
初始化神经网络:确定神经网络l-K-1的连接方式,即输入层神经元为l个,隐含层神经元为K个,输出层神经元为1个;对神经网络的权值进行随机赋值;神经网络的输入表示为x=(x1,x2,...,xl)T,(x1,x2,...,xl)T为(x1,x2,...,xl)的转置,神经网络的期望输出表示为yd;设共有M个训练样本,则第t个训练样本为x(t)=(x1(t),x2(t),...,xl(t))T,用第t个训练样本训练神经网络时,弹性RBF神经网络的输出可描述为:
其中,K是隐含层神经元数,x(t)=(x1(t),x2(t),...,xl(t))T是输入向量,wk是第k个隐含层神经元与输出层神经元的联结权值;θk是第k个隐含层神经元的输出,即
其中,μk是中心值,σk是方差;
定义误差函数为
M为训练样本总数,yd(t)和y(t)分别是t时刻神经网络的期望输出和实际输出,训练RBF神经网络的目的是使得式(3)定义的误差函数达到期望值;
(2)对样本数据进行校正;
设N个数据样本(x(1),x(2),...,x(N)),均值为χ,每一个样本的偏差为D(j)=x(j)-χ,j=1,2,...,N,计算标准偏差:
若某一个样本x(j)的偏差满足:
|D(j)|≥3σ,,j=1,2,...,N, (5)
则认为样本x(j)是异常数据,应予以剔除,得到校正后的数据,该数据作为神经网络的训练样本和测试样本;
其特征还包括以下步骤:
(3)用校正后的数据训练神经网络,在训练过程中,首先,利用神经元的活跃度函数判断神经元的活跃性,对活跃度较强的神经元进行分裂;其次,通过计算交互信息相关性函数,分析RBF神经网络隐含层神经元与输出层神经元间的连接强度,从而根据交互信息强度对网络结构进行修改;最后,对神经网络参数进行调整,直到网络结构满足处理信息的需求;
具体为:
①给定一个RBF神经网络,隐含层神经元为K,K为小于100的正整数,初始化神经网络权值wk,其值为0到1的随机数,中心值μk为与训练样本相关的数,期望误差设为Ed,方差σk∈[0.01,2],进行训练;
②输入样本数据进行运算,计算神经元i的活跃度Afi,
其中,i=1,2,...,K,Afi是隐含层第i个神经元的活跃度,K是隐含层神经元数,θi是隐含层第i个神经元的输出,τ∈[0.01,0.1],避免‖x-μi‖为零时活跃度函数有解;如活跃度Afi大于活跃度阀值Afo∈[0.01,0.2],分裂神经元i,调整网络结构,设定新神经元的初始参数:
μi,j=αjμi+βjx,
σi,j=αiσi, (7)
其中,j=1,2,...,Nnew,ai∈[0.95,1.05],βi∈[0,0.1],μi和σi分别是神经元i的中心值和方差,μi,j和σi,j分别是新神经元j的中心值和方差,Nnew是新增神经元数,其值是小于5的正整数,根据神经元活跃度确定所增神经元数;新神经元与输出神经元间的连接权值设定为
其中,j=1,2,...,Nnew,rj∈[0,1]是新神经元j的分配参数,θi(x)是神经元i的输出,θi,j(x)是新神经元j的输出,wi是分裂神经元i与输出层神经元的联结权值,是当前神经网络的误差,描述为如果神经网络中有1个神经元分裂为Nnew个新神经元,则神经网络隐含层神经元通过分裂后变为K+Nnew-1个;
③计算隐含层神经元X与输出层神经元Y间的连接强度m,
假设X和Y是相互连接的神经元,交互信息的强度M(X;Y)依赖于神经元X和Y间的平均信息量,根据香农熵理论,神经元X和Y间的连接强度为:
M(X;Y)=H(X)-H(X|Y)=H(X)-H(Y|X), (9)
其中,H(X)为X的香农熵,H(Y|X)为Y在X条件下的熵;由公式(9)可知,当神经元X和Y相互独立时,M(X;Y)的值为0;否则,M(X;Y)为正数;所以,M(X;Y)≥0,并且
M(X;Y)≤min(H(X),H(Y)). (10)
规则化交互信息的强度
其中0≤m(X;Y)≤1,通过计算m,能够确定神经元X和Y间相关性,即连接强度;设定m0∈[0,0.01],在RBF神经网络中,当m(X;Y)≥m0时则说明神经元X和Y间的信息交互较强,认为X和Y间有连接——图2(a);当m(X;Y)<m0时则表明神经元X和Y间的信息交互强度较弱,在网络结构调整时可忽略神经元X和Y间的连接——图2(b),从而降低神经网络的冗余度;
如神经元间需要调整,则跳往步骤④,否则跳往步骤⑤;
④神经元X和Y间的连接断开,在隐含层找出与神经元X间欧氏距离最近的神经元Z,神经元Z的参数为:
μ′Z=μZ,
σ′Z=σZ,
其中,wZ,μZ和σZ为结构调整前神经元Z与输出层神经元Y间的连接权值、中心值和方差,w′Z,μ′Z和σ′Z为结构调整后神经元Z与输出层神经元Y间的连接权值、中心值和方差,wX为结构调整前神经元X与输出层神经元Y间的连接权值,θX(x)是隐含层神经元X的输出,θZ(x)是隐含层神经元Z的输出;通过结构调整,神经网络隐含层冗余神经元得到修剪,假设原来隐含层神经元为K个,需要调整的神经元为Ncut个,则调整后神经网络隐含层神经元变为K-Ncut个;
⑤根据误差函数式(3)来调整神经网络隐含层所有神经元的输出权值w、中心值μ和函数宽度σ;
⑥误差函数式(3)的值达到期望误差Ed时停止计算;
(4)对测试样本进行检测:将测试样本数据作为训练好的神经网络的输入,神经网络的输出即为出水BOD的软测量结果;
本发明的创造性主要体现在:
(1)本发明针对当前污水处理中关键参数生化需氧量BOD测量周期长,不能在线检测的问题,根据神经网络可以逼近非线性函数的特点,采用了弹性RBF神经网络实现辅助变量与BOD之间的映射,对BOD进行在线软测量,具有实时性好、稳定性好、精度高等特点。从而省去了研制传感器的复杂过程以及降低运行成本;
(2)本发明依据神经元的活跃度以及神经元间的交互信息强度对网络结构进行调整,不但能够增加隐含层神经元,同时能够删除冗余的神经元,进而调整神经网络的拓扑结构,解决了神经网络结构难以确定的问题,避免了神经网络规模过于复杂而需要较大的存储空间和计算时间;规模过小而信息处理能力又有限;
特别要注意:本发明只是为了描述方便,采用的是对BOD进行软测量,同样该发明也可适用于COD等,只要采用了本发明的原理进行软测量都应该属于本发明的范围。
附图说明
图1是本发明的软测量神经网络拓扑结构;
图2是神经元X和Y间连接图;
图3是本发明拟合结果图,其中黑色实线为BOD实测值,红色虚线为BOD拟合值;
图4是本发明拟合结果误差图;
图5是本发明软测量结果图,其中黑色实线为BOD实测值,红色虚线为BOD软测量值;
图6是本发明软测量结果误差图;
表1-12是本发明实验数据,表1-4为训练样本,表5为BOD实测值,表6为神经网络拟合值,表7-10为检测样本,表11为BOD实测值,表12为软测量值。
具体实施方式
本发明选取测量BOD的辅助变量SS、pH、DO、COD,其中SS是进水水质中固体悬浮物,pH是进水水质的酸碱度,DO是进水水质中溶解氧浓度,COD是进水水质中能被氧化的物质在被化学氧化剂氧化时所需要的氧量,除pH没有单位外,以上单位均为毫克/升;
实验数据来自某污水处理厂2008年水质分析日报表。实验样本经数据预处理后剩下200组数据,将全部的200组数据样本分为两部分:其中100组数据用作为训练样本,其余100组数据作为测试样本,实验数据如表1-5和表7-11所示;图1为BOD神经网络软测量模型,其输入分别为SS、pH、DO、COD,采用4-5-1的连接方式,即4个输入神经元,5个隐含层神经元,1个输出神经元;
弹性RBF神经网络算法具体步骤如下:
(1)初始化神经网络:确定4-5-1的连接方式,对神经网络的权值wk进行随机赋值,其值为0到1的随机数,w1=0.46,w2=0.21,w3=0.29,w4=0.11,w5=0.38;中心值μ1=[-0.43,-0.77,-0.81,0.16],μ2=[1.2,2.6,-2.3,0.16],μ3=[1.16,0.03,1.15,0.83],μ4=[0.51,1.52,-0.51,1.33],μ5=[1.56,0.79,0.65,-1.56];方差σ1=σ2=σ3=σ4=σ5=0.25;输入分别为SS、pH、DO、COD的值,输出为BOD的值;
(2)对样本数据进行校正,分别取SS、pH、DO、COD校正完的数据200组,其中100组用于训练,数据在表1-5中,表1-4为神经网络输入数据,表5为实际系统输出数据,表6为神经网络输出数据;
(3)用校正后的训练样本数据训练神经网络,在训练过程中,首先,利用神经元的活跃度函数判断神经元的活跃性,对活跃度较强的神经元进行分裂;其次,通过计算交互信息相关性函数,分析RBF神经网络隐含层神经元与输出层神经元间的连接强度,从而根据交互信息强度对网络结构进行修改;最后,对神经网络参数进行调整,直到网络结构满足处理信息的需求,提高神经网络的计算速度和信息处理能力;
具体为:
①训练给定初始化RBF神经网络,设计期望误差Ed=0.01;
②输入样本数据进行运算,根据公式(6)计算神经元i的活跃度Afi,且活跃度阀值Afo=0.15,通过计算得到,神经元的活跃度分别为Af1=0.3534,Af2=0.0166,Af3=0.1237,Af4=0.0892,Af5=0.1167;神经元1的活跃度大于活跃度阀值Afo,分裂神经元1,神经元1分裂成3个神经元,分裂后隐含层神经元数变为7个,分裂后的第一个新神经元填补原来神经元的位置,其他分裂的新神经元在原来隐含层神经元的基础上增长,因此,分裂后的3个神经元第一个填补原来神经元1的位置,其他两个为隐含层神经元6和神经元7,调整网络结构,根据公式(7)和(8)设定新神经元的初始参数;
w1=0.39,w6=0.07,w7=0.03,
μ1=[-0.32,-0.57,-0.97,0.13],μ6=[-0.45,-0.51,-0.66,0.11],μ7=[-0.10,-0.64,-0.91,0.25],
σ1=0.24,σ6=0.24,σ7=0.24;
其他没有分裂的隐含层神经元与输出层神经元间的连接权值、中心值和方差不调整;
③计算隐含层神经元X与输出层神经元Y间的连接强度m,设定m0=0.005,通过计算得到m1=0.7534,m2=0.0016,m3=2.3117,m4=3.0664,m5=3.3252,m6=0.8664,m7=1.0001;隐含层神经元2与输出层神经元间的连接强度m2小于m0,其他隐含层神经元与输出层神经元间的连接强度m大于m0,因此神经网络需要调整,跳往步骤④;如神经元间连接不需要调整,则跳往步骤⑤,图2给出了隐含层神经元与输出层神经元间调整结构;
④隐含层神经元2和输出层神经元Y间的连接断开,在隐含层找出与神经元2欧氏距离最近的神经元5,神经元5的参数根据公式(12)进行调整;调整后隐含层神经元5的连接权值、中心值和方差分别为:
w′5=0.47,,μ′Z=[1.56,0.79,0.65,-1.56],σ′Z=0.25,
通过调整隐含层神经元数变为6个,神经网络的结构得到调整;
⑤根据误差函数(3)调整神经网络隐含层所有神经元的输出权值w、中心值μ和方差σ;
⑥误差函数(3)的计算值达到期望误差Ed时停止计算;
(4)对测试数据进行检测:将测试样本数据作为训练好的神经网络的输入,数据在表7-10中,系统实际输出数据在表11中,神经网络的输出即为出水BOD的软测量结果,数据在表12中;图5为测量结果,图6为测量误差;
图3为出水水质BOD训练结果图,X轴:输入样本点,Y轴:生化需氧量BOD(毫克/升),实线是实际系统输出值,虚线为神经网络输出值;图4为出水水质BOD训练结果误差图,图5为出水水质BOD软测量情况图,X轴:输入样本点,Y轴:生化需氧量BOD(毫克/升),实线是实际系统输出值,虚线为神经网络输出值;图6为软测量误差,结果证明该方法的有效性。
训练数据:
表1.辅助变量COD的输入值(mg/L)
表2.辅助变量SS的输入值(mg/L)
表3.辅助变量pH的输入值
表4.辅助变量DO的输入值(mg/L)
表5.BOD的实测输出值(mg/L)
表6.BOD的拟合值(mg/L)
检测数据:
表7.辅助变量COD的输入值(mg/L)
表8.辅助变量SS的输入值(mg/L)
表9.辅助变量pH的输入值
表10.辅助变量DO的输入值(mg/L)
表11.BOD的实测输出值(mg/L)
表12.BOD的软测量值(mg/L)
机译: 允许光电和呼吸测量传感器共同运行的系统和方法,可即时准确地确定液态工业废物中的生化需氧量(BOD)
机译: 测量细胞分析仪,方法,计算机程序以及用于测量生化需氧量(BOD)的所述程序的支持。
机译: 以糖酵母作为生物识别元素的生化需氧量(BOD)快速测定方法