首页> 中文学位 >拉丁超立方体设计的构造与超饱和设计的分析
【6h】

拉丁超立方体设计的构造与超饱和设计的分析

代理获取

摘要

科学试验是人们认识自然,了解自然的重要手段,它被广泛应用于人类生活实践的各个方面。随着科学技术的发展,试验研究的对象涉及因素越来越多,因素之间的关系越来复杂,仅靠直觉和经验已经远远不能满足试验要求,于是试验设计应运而生。设计一个试验要考虑的环节很多:试验目的、试验方案、试验设计、试验实施、数据分析,其中需要利用数学和统计学知识来解决的是试验方案的设计和数据分析两大环节。试验的设计问题和分析问题之间是有制约关系的,设计出的试验不仅要求试验次数尽量少,而且所包含的有用信息要尽量多,要便于试验结果的分析;分析方法又要依赖于设计方法,不同的设计方法的试验结果需要采用不同的分析方法。
  试验设计源于统计学家R.A.Fisher在上世纪30年代英国Rothamsted农场试验站的开创性工作,至今已有80多年历史。最初的试验设计问题都是受农业和生物学中的问题的激励,像著名的孟德尔豌豆试验。这些试验的特点是试验结果受随机误差的影响,同样的条件,其观测结果会因随机误差而产生波动。在试验室、工厂或者农场中进行的实体试验,都不可避免的具有这种随机性。我们称这样的试验为实体试验。针对实体试验,提出了很多的设计准则:随机化、分区组、重复性、正交性等。基于这些准则的设计,像正交设计、回归设计、区组设计和拉丁方设计,在实践中已经得到成功的应用。近几十年来,随着计算机技术的飞速发展,计算机在研究中得到越来越多的应用。传统的实体试验存在花费高、周期长等问题,甚至一些试验根本不可能进行,像研究飓风破会性问题,这时在计算机上进行模拟试验成为一个新的突破点。计算机试验是指在计算机上利用代码来模拟具体的情形,获得试验数据。通过试验寻找一个拟模型来代替现实中的复杂模型是近年来计算机试验的一个热点。计算机试验与实体试验最大的区别是计算机试验的输出结果没有随机性,相同的输入条件下,其输出结果一致。因此计算机试验的设计和分析需要新的准则和方法。
  拉丁超立方体设计是具有一维投影均匀性的设计,它能够很好的适应计算机试验输出结果没有随机性的特点,因而被广泛地应用于计算机试验。自从这种试验在1979年被提出之后,很多学者作了大量的工作改进这种设计:保留它的一维投影均匀性,增加其它准则,找出具有其它性质的拉丁超立方体设计。例如增加因子之间的正交性或者增加二维甚至更高维的投影均匀性。在回归模型下,正交因子效应的估计之间是不相关的;增加高维的投影均匀性,能够减小预测的方差。因此增加正交性和均匀性对于正确的分析试验数据是很有必要的。傅里叶多项式模型由Butler(2001)提出,用于试验数据的分析。在科学试验的初期,我们往往对模型所知不多,甚至一无所知,傅里叶多项式模型由于能够很好地逼近多项式模型也能很好地逼近空间模型,而非常适用于模型未知情形,试验设计初期的因子筛选设计的分析。对于傅里叶多项式模型,经过适当的变换,它可以写成多项式回归模型的形式,因此需要寻找具有以下性质的拉丁超立方体设计:所有的线性效应相互正交;所有的线性效应与二阶效应,即平方效应和双线性效应,相互正交。Butler(2001)将因子设计中的分辨度概念引入了拉丁超立方体设计当中,称满足以上条件的设计具有分辨度Ⅳ。
  在计算机试验中,同样要面临试验中既有定性因子又有定量因子的情形。这时整个定量因子对应的试验设计部分,我们希望它是一个拉丁超立方体设计且具有一维以上的投影均匀性或者正交性;同时对于每个定性因子组合,希望它所对应的定量因子的设计部分,仍然具有同样的性质。在计算机试验中,尽管计算机试验花费少,但有时时间成本高;像一些有限元模型,计算机程序运行几个星期的时间才能完成一次试验是很常见的。这时采用不同精度的模型来降低试验成本是一个很好的选择。分片拉丁超立方体设计能够很好的解决这些问题,成为近年来计算机试验的研究热点之一,目前尚有许多问题值得研究。
  试验数据一旦得到,随之而来的就是选取正确的分析方法对数据进行分析,从而获得有用的信息。标准的分析方法,像方差分析、回归分析等,已经在实践中得到应用并解决了很多问题。但是对于新出现的设计,这些传统的分析方法难以得到令人满意的分析结果。超饱和设计因其能够利用较少的试验次数研究较多的因子效应,而得到很多学者的关注。在超饱和设计的构造方面,近20年里,学者们提出了很多新的最优理论和构造方法。然而相对于构造方面的快速发展,超饱和设计的数据分析亟需更多的研究。目前针对超饱和设计的数据分析,虽然提出了一些方法,但是没有一种是特别令人信服的。如何分析和解释来自超饱和设计的试验数据仍然是一个棘手的问题,特别是针对多响应的情形。现有的超饱和设计分析方法,研究的是只有一个响应的情形,但在实际生活中,具有多响应的超饱和设计的试验很常见,这方面数据分析的研究还是空白。
  下面简要介绍一下本文各章的内容。
  第一章为引言。简要介绍一些背景知识及一些相关的概念。
  第二章给出了傅里叶多项式模型下具有分辨度Ⅳ的正交拉丁超立方设计的构造方法。本章构造的设计绝大多数与Butler(2001)构造的设计具有不同试验次数,是最新的设计。而且我们证明了具有此种正交性的拉丁超立方体设计最多能安排的因子数是试验次数的一半。这些设计对于计算机试验中的因子筛选和建立傅里叶模型非常有用。
  第三章给出了基于正交表构造分片拉丁超立方体设计的方法。首先,提出了一种基于对称正交表构造分片拉丁超立方体设计的方法。该方法所得到的分片拉丁超立方体设计不仅具有分片结构,而且具有非常好的低维投影均匀性。同时,每一小片也是一个拉丁超立方体设计,且具有和整体拉丁超立方体设计同样的低维投影均匀性。进一步,我们提出了基于非对称正交表构造分片拉丁超立方体设计的方法。利用该方法构造的设计与基于对称正交表构造的设计具有相似的性质,但是在低维投影均匀性上,该方法可以在不同因子组合上达到不同的低维投影均匀性。本章的构造方法不仅容易实现,而且不同于已有的方法,得到的设计在行数和因子数上都非常灵活。
  第四章给出了一种适用于多响应超饱和设计的两阶段变量选择策略。该方法将多元偏最小二乘回归方法与逐步回归方法结合,对多响应超饱和设计进行数据分析。本章的方法相对于单响应超饱和设计的分析方法,能够充分的利用观测阵中的信息,因而更能有效地筛选活跃效应。
  第五章对本文的工作进行了总结和讨论。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号