首页> 中文学位 >相依数据下协变量调整回归模型及其在金融时间序列中的应用
【6h】

相依数据下协变量调整回归模型及其在金融时间序列中的应用

代理获取

目录

声明

摘要

第一章 序言

§1.1 随机变量的独立性与相依性

§1.2 时间序列

§1.3 统计模型简介

§1.3.1 参数回归模型

§1.3.2 变系数回归模型

§1.3.3 非参数回归模型

§1.3.4 函数的非参数估计方法

§1.3.5 窗宽的选择

§1.4 协变量调整模型

§1.5 稀疏信号检测

第二章 相依数据下协变量调整参数回归模型

§2.1 独立同分布场合的协变量调整模型

§2.2 相依数据场合的协变量调整模型

§2.3 渐近性质

§2.4 拟合优度检验

§2.5 应用与模拟

§2.5.1 模拟计算

§2.5.2 在金融数据中的应用

§2.6 主要结果的证明

§2.7 附录

第三章 相依数据下协变量调整非参数回归模型

§3.1 引言

§3.2 模型和估计

§3.3 渐近性质

§3.4 数值计算

§3.4.1 模拟计算

§3.4.2 在金融数据中的应用

§3.5 结论证明

第四章 基于局部LRS方法的稀疏信号片段检测

§4.1 引言

§4.2 局部LRS方法

§4.3 渐近性质

§4.4 模拟计算

§4.5 结束语

参考文献

作者简介

致谢

学位论文评阅及答辩情况表

展开▼

摘要

经典的统计学是建立在独立性假设之上的.独立随机变量的极限理论在20世纪30年代至40年代已经得到完善的发展,这些极限理论在统计学中起着至关重要的作用,是人们进行统计推断的理论基础.虽然独立性假设在某些时候是合理的,但是要验证一个样本的独立性是很困难的.而且在大部分的实际问题中,样本也并非是独立的观测值,因此,在20世纪50年代,随机变量的相依性概念引起了概率统计学家的研究兴趣,在概率论与数理统计的某些分支,如马氏链,随机场理论以及时间序列分析等学科中被相继提出,取得了大量的研究成果.在相依数据的研究中混合相依是广泛应用的概念.混合相依是指序列变量之间的相依关系是以时间或空间的距离衰退的,即当随机变量的指标只差趋于无穷时,随机变量是渐近独立的.
   在经济金融,气象,水文,工程技术,自然科学和社会科学各个领域中,人们会遇到各种各样的数据,这些数据大多以时间序列的形式出现的.例如股票的每日收盘价格,产品的年销量,国民生产总值的年数据等等.因此,对时间序列进行研究,可以揭示各种现象变化和发展的内在规律,对于人们正确的认识事物并且由此作出科学的决策具有重要的现实意义.
   协变量调整回归模型是最近新提出的一种统计分析方法.假设X和Y分别为预测变量和响应变量,在传统的回归模型中,通过(X,Y)的观测值来研究X和Y之间的关系.但是,在实际问题中,变量X和Y有可能会受到其他因素的干扰,如果在进行统计分析时没有把干扰因素考虑进来,就可能会得到不准确的或者是错误的统计推断.而协变量调整回归模型就是考虑干扰因素的影响,称干扰因素为协变量,研究在协变量影响下X和Y之间的关系.
   协变量调整模型提出以后,由于其重要的现实意义和应用价值,受到了人们的广泛关注,出现了各种各样的推广,主要包括数据类型的推广和模型类型的推广.数据类型的推广大多是把独立同分布场合推广到纵向数据场合.模型类型的推广主要包括变系数模型,非线性模型和部分线性模型等等.本文中,我们在数据类型和模型类型两方面都做了推广.数据类型方面,我们把独立同分布场合推广到相依数据场合,从而应用到金融数据中.模型类型方面,我们分别讨论了相依数据下的参数回归模型和非参数回归模型.
   1.相依数据下协变量调整参数回归模型
   在第二章,我们讨论了相依数据下的协变量调整参数回归模型,{Yi=p∑r=0γrXir+ei,(Y)i=(Φ)(Ui)Yi,(X)ir=φr(X)ir,r=0,…,p;i=1,…,n.其中Xi0=1,φ0(·)(=)1.假设不可观测数据{(Ui,Xi,Yi),i=1,2,…,n}为一个满足α-混合条件的严平稳过程.我们的目标是,基于观测数据{(Ui,Xi,Yi),i=1,2,…,n}估计未知回归参数γr(r=0,1,2,…,p)并且研究估计的渐近性质.我们提出了一个两步估计方法
   第一步.首先把协变量调整模型转换为(Y)i=p∑r=0βr(Ui)(X)ir+εi,其中βr(Ui)=γr(Φ)(Ui)/φr(Ui),εi=(Φ)(Ui)ei,φ0(Ui)=1,i=1,…,n;r=0,…p.(
   )这是一个函数型系数模型.我们采用局部线性平滑方法估计模型中的系数函数数βr(·),r=0,…,p.记θ≡θ(u0)=(β(u0)T,β'(u0)T),最小化下面的加权平方和n∑i{(Y)i-p∑r=0[βr(u0)+βr'(u0)(Ui-u0)](X)ir}2Kh(Ui-u0),可以得到θ的最小二乘估计(θ)=((X)TW(X))-1(X)TW(Y),则系数函数βr(·)的估计为βr(=)βr(u0)=eTr,2p+2(θ),其中eTr,2p+2为2p+2维向量,第r个元素为1,其他元素为零.
   第二步.我们提出回归参数γr,r=0,1,…,p的估计为(γ)0=1/nn∑k=1(β)0(Uk)(γ)r=1/(X)·1/nn∑k=1(β)r(Uk)(X)kr,r=1,2…,p,其中(X)r=1/n∑nk=1(X)kr.
   我们讨论参数估计的渐进性质.定理2.1证明了估计的相合性,并且给出了收敛速度.定理2.2证明了参数估计的渐近正态性.
   定理2.1.(相合性定理)假设模型满足§2.6节中的条件(C2-1)-(C2-9),则下面的结论成立(γ)r=γr+OP((nh)-1/2)+OP(h2)+OP(n-1/2),r=0,1,…,p.
   定理2.2.(渐近正态性)假设模型满足§2.6节中的条件(C2-1)-(C2-9),当n→∞时,下面的结论成立√n((γ)r-γr)D→N(0,σ2r),r=0,1,…,p,其中σ2r=γ2rE[(Φ)2(U)E(X2r)]-γ2rE[φr(U)(Φ)(U)]E(X2r)+γ2r[E(Xr)]2+γ2rvar((X)r)/[E(Xr)]2
   为了比较协变量调整模型和一般线性模型对数据的拟合程度,我们提出了一种拟合优度检验.设协变量调整模型转换为下面的函数型系数模型Y=β0(U)+β1(U)X+ε.如果函数βr(·)(r=0,1)为常数,即βr(U)(=)βr(r=0,1),则模型转换为一个简单的线性回归模型Y=β0+β1X+ε,这说明线性回归模型与数据拟合地更好,否则,若βr(·)(r=0,1)不恒为常数,则函数型系数模型与数据拟合地更好.设原假设为H0∶βr(U)(=)βr,r=0,1.检验统计量为Tn(△)(RSS0-RSS1)/RSS1=RSS0/RSS1-1.(
   )若Tn取值较大,则拒绝原假设.我们提出了一种非参Bootstrap方法来计算上述拟合优度检验的p值.
   为了阐明提出的方法,我们研究金融市场中铜现货价格CSP(响应变量)和铜期货价格CFP(预测变量)的关系.一个简单的线性回归关系为CSP=β0+β1CFP+e.(
   )另外,沪深300股指期货(IF)对CSP和CFP之间的关系有显著地影响.因此,我们把IF作为协变量U,考虑下面的函数型系数回归模型CSP=β0(IF)+β1(IF)CFP+ε,为了对模型进行检验,我们采用§2.4中提出拟合优度检验.结果说明CSP和CFP之间存在非线性关系并且两者之间的关系随着IF的变化而变化.
   2.相依数据下协变量调整非参数回归模型
   在第三章,我们提出了相依数据下协变量调整非参数回归模型,其样本形式为{Yi=m(Xi)+εi,Yi=(Ψ)(Ui)Yi,Xi=φ(Ui)Xi,i=1,…,n.假设不可观测样本{(Ui,Xi,Yi),i=1,2,…,n}为联合严平稳α-混合序列.
   为了估计回归函数,我们如下的两步估计方法:
   第一步.干扰函数Ψ(U)和φ(U)的估计为(Ψ)(u)=1/nΣni=1Kh1(u-Ui)(Y)i/1/nΣnj=1Kh1(u-Uj)×1/(Y)(△=)(g)(Y)(u)×1/(Y)(φ)(u)=1/nΣni=1Kh2(u-Ui)(X)i/1/nΣnj=1Kh2(u-Uj)×1/(X)(△=)(g)(X)(u)×1/(X)我们可以建立一个协变量调整模型的近似表达Yi≈m(Xi)+εi.
   第二步.我们提出回归函数的Nadaraya-Watson估计为(m)(x)=1/nΣni=1Kh0(x-(X)i)(Y)i/1/n∑nj=1Kh0(x-(X)i)(△=)n∑i-1Wh0(x-(X)i)(Y)i,其中Wh0(x-(X)i)=Kh0(x-(X)i)/∑nj=1Kh0(x-(X)i).
   定理3.1证明了回归函数的估计(m)(x)的渐近收敛性,并且给出了收敛速度.
   定理3.1如果§3.5中条件(A3-1)-(A3-3)以及(C3-1)-(C3-5)满足,则下面的结论成立:supx|(m)(x)-m(x)|=OP(h+(nh/log(1/h)-1/2).
   我们通过模拟计算和实际数据应用表明了协变量调整非参数回归方法的优良性.
   3.基于局部LRS方法的稀疏信号片段检测
   稀疏信号检测问题一直是信号处理中的热点问题.在高维数据中进行稀疏信号检测时经常会面临会两个挑战,一是如何提高检测精度,二是如何降低计算复杂度.在第四章,我们提出了一个局部LRS方法.与一般的LRS方法相比,局部LRS方法能显著地提高检测精度,降低计算复杂度.假设观测样本{Xi,i=1,2,…,n}来自于模型Xi=μ1I{i∈I1}+μ2I{i∈I2}+…+μqI{i∈Iq}+Zi,1≤i≤n,其中I1,I2,.,Iq为不相交区间,表示位置未知的信号片段,μ1,μ2,…,μq为未知的信号强度.q=q(n)为未知的信号片段的个数,会随着n的增加而增加.{Zi,i=1,2,…,n}为噪声,令Ⅱ={I1,I2,…,Iq}表示所有的信号片段的集合.我们的目标是检测信号片段是否存在,如果存在,识别信号片段的位置.我们把上述信号片段的检测和识别问题看作下面的假设检验问题,H0∶Ⅱ=ΦVS.H1∶Ⅱ≠Φ,其中西表示空集.如果H1为真,说明信号片段存在,从而我们要确定信号片段集合Ⅱ.提出的检验统计量为X[I]=∑i∈IXi/√|I|检验统计量的阈值为t2n=√2logN.
   我们提出的LRSL算法首先从所有的点中选出观测值大于t1n的“重要的”点,然后再考虑每一个“重要的”点的L-邻域.那么信号片段的合理估计应该是对应的检验统计量大于t2n并且取到最大值的那些区间.
   定理4.1证明了检验方法的渐近性质.
   定理4.1设§4.3中的条件(C4-1),(C4-2)满足,另外假设K=(0)(√2logN),γn(>)1/√2logN,其中γn=√1+∈n-1且∈n>0.那么,如果满足μ≥√2(1+∈n)logN/√|I|,则下面的结论成立PH0{拒绝H0}+PH1{接受H0}→0.模拟结果表明,局部LRS方法可以有效地提高检测精度,降低计算复杂度.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号