首页> 中文学位 >基于GEP函数发现的智能模型库关键技术研究
【6h】

基于GEP函数发现的智能模型库关键技术研究

代理获取

目录

文摘

英文文摘

1前言

2基因表达式编程基本概念和术语

3函数发现技术中的数据预处理

4基因表达式编程收敛性分析

5基于基因表达式编程的智能模型库系统的实现

6基于基因表达编程的智能模型库技术的算法研究

7总结及未来工作展望

参考文献

作者在读期间科研成果简介

致谢

展开▼

摘要

计算机技术广泛而深入的应用对决策支持提出了更高的要求。智能决策支持系统(Intelligent Decision Support Systems,IDSS)应运而生。 模型库子系统是决策支持系统的核心。但传统模型库的建立方法存在以下缺点: (1)需预先确定好模型库中模型的类型,DSS只能根据样本数据对现有的模型进行有关参数计算,进而让决策者根据结果来进行预测。这种模型库缺少了真正意义上的智能寻找模型类型的功能。 (2)可能依赖领域的专家经验。如专家系统需要一个内容丰富而全面的知识库支撑,依靠的是某领域的专家经验,因此,该智能模型库对先验知识依赖性很强,难以实现真正意义上的智能化。 (3)在预先不知模型类型时,需凭经验确定模型类型,含有主观和盲目因素。 (4)传统方法目前不能支持复杂函数关系式和多分段函数关系式等模型的建立。 (5)扩展性较差。针对不同的函数模型类型,在程序实现时就必须有一个新的程序模块。当模型库要进行扩充,系统就要为该模型增加新的代码。 为了解决以上问题,本文将基因表达式编程(Gene Expression Programming,GEP)技术引入智能模型库的研究中。 基因表达式编程具有极强的函数发现能力和很高的效率,并且在函数发现时不需要任何先验知识,无需预存函数模型的类型,避免了传统算法建模时事先选定函数类型的盲目性。 基因表达式编程研究领域尚有许多空白点,如GEP的理论分析、基于GEP属性约简的函数挖掘、基于残差分布适应度GEP方法等等。本文的工作是基于这些空白点展开,并将GEP这种新技术引入到DSS。 本文主要贡献如下: (1)提出并实现了两种数据预处理方法: i.复共线性数据的预处理算法ε-MDPA(ε-Multicollinearity Data Preprocessing Algorithm),该方法是针对在函数发现中要处理的数据具有复共线性时数据的预处理办法 ii.基于Hash函数取样的数据预处理算法HSDPA(Hash Sampling Based Data Preprocessing Algorithm),其中的取样是在总体数据太庞大时,为了提高函数发现的效率和样本质量,所采取的抽样技术。 (2)针对GEP理论的不足或空白点,对GEP的基本概念进行了一系列的形式化描述。利用马尔可夫链理论,对群体为离散型的GEP进行了收敛性分析,证明了GEP的马尔可夫链收敛性定理。针对群体为一般型的GEP,分析了适应度函数的收敛性,并证明了最小残差平方和依概率收敛定理。在理论上保证了GEP方法的可靠性和可行性。 (3)提出了显式模型概念和基于GEP的显式模型挖掘算法(GEP-Explicit Model Mining Algorithm, GEP-EIMA),新方法兼容了传统函数发现算法显式模型的挖掘,实现了系统的易扩展性。同时,通过实验验证了算法的有效性。 (4)根据GEP函数发现依概率收敛定理,提出了基于GEP的残差制导进化算法(GEP-RGEA),提高了GEP算法的效率。并通过3个实验与GP以及其它预测方法进行了对比性实验。实验结果表明,在噪声数据很小的情况下,三种算法均挖掘出目标函数,但GEP比GP的收敛速度提高了20倍,RGEA比GP提高了60倍。对于函数类型未知且极为复杂的数据,GEP和RGEA在发现理想函数的速度上要比GP分别快900、1800倍。 (5)提出了边际基因、边际适应度、残差分布适应度概念以及基于边际适应度和残差分布适应度的GEP算法(GEP-MFRDF),算法保证了残差服从近似正态分布,克服了传统GEP算法一味追求残差绝对值小,忽略残差应满足正态分布的要求,有可能导致系统误差的不足。提出了基于GEP的贪婪式属性约简函数挖掘算法(GEP BasedGreedy Attribute Reduction Function Mining Algorithm, GEP-GARFMA)和基于GEP的逐步属性约简函数挖掘算法(GEPBased Stepwise Attribute Reduction Function Mining Algorithm,GEP-SARFMA),使系统能在自变量很多情况下自动实现属性约简的函数挖掘功能。通过两个实验验证了算法的有效性。实验表明:(a)GEP-GARFMA和GEP-SARFMA在发现最优函数表达式时,均能有效地进行属性约简;(b GEP-SARFMA发现的函数表达式精度与GEP-GARFMA方法差不多;(c)当自变量个数为20时,GEP-SARFMA方法比GEP-GARFMA快300倍;(d)使用GEP-SARFMA挖掘的函数模型的适应度函数值比传统方法提高24.6%。 (6)提出并实现了基于GEP函数发现的智能模型库系统(GEP BasedIntelligent Model Base System, GEP-IMBS),给出了GEP-IMBS系统与GIS、DSS等接口技术。该系统是真正意义的无先验知识的智能模型库系统,模型的类型和参数的求解均由程序自己来实现。通过一个真实数据实验验证GEP-IMBS系统在函数挖掘上的有效性,实验表明,GEP-IMBS系统挖掘的函数模型精度比传统方法提高了近十五个百分点。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号