首页> 中文学位 >带马尔科夫链的随机最优控制问题及其在金融中的应用
【6h】

带马尔科夫链的随机最优控制问题及其在金融中的应用

代理获取

目录

声明

摘要

符号说明

第一章 带马尔科夫链模型下的最优转换问题及其在股票交易问题中的应用

§1.1 引言

§1.2 问题描述和预备结果

§1.3 动态规划原理和变分不等式

§1.4 双时间尺度情形

§1.5 在股票交易问题中的应用

§1.5.1 两个状态的情形

§1.5.2 四个状态的情形

第二章 随机离开时间和不完备市场下的均值-方差证券投资组合问题

§2.1 引言

§2.2 问题描述

§2.3 可行性

§2.4 SRE和辅助BSDE的可解性

§2.5 不受限问题的解

§2.6 有效投资组合与有效前沿

第三章 带马尔科夫链和泊松跳的正倒向系统的最大值原理及其在金融中的应用

§3.1 引言

§3.2 问题描述

§3.3 充分性随机最大值原理

§3.4 与动态规划原理的关系

§3.5 在金融中的应用

第四章 带马尔科夫链的正倒向超前-延迟系统的最大值原理

§4.1 引言

§4.2 问题描述

§4.3 最优控制的必要性和充分性条件

§4.3.1 最大值原理

§4.3.2 充分性条件

§4.4 在递归效用投资-消费问题中的应用

参考文献

攻读博士学位期间发表及完成的论文

致谢

展开▼

摘要

本篇论文主要研究了带马尔科夫链的随机最优控制问题,及其在金融中的应用。在理论方面,主要研究了与带马尔科夫链模型相关的最优控制理论,如随机最大值原理,动态规划原理以及它们之间的关系。然后,我们将得到的理论结果应用于金融数学问题,如股票交易问题,证券投资组合,效用最大化问题,最优投资-消费问题等。
  在实际中,很多现象或系统都具有状态转移或者趋势改变的性质。对于这种情形,数学上,我们一般使用马尔科夫链来刻画。例如,在股票市场中,市场可以分为牛市和熊市,市场在这两种趋势之间转换。在牛市中,股票的收益率是正的,波动率较小,而在熊市中,股票的收益率是负的,波动率也较大。此时,我们可以使用一个两状态的马尔科夫链来描述,一个状态代表牛市,一个状态代表熊市,使股票价格方程依赖于这个马尔科夫链。马尔科夫链状态的转移,代表着市场趋势的改变。从这个例子我们可以看出,马尔科夫链可以较好地模拟现实环境的随机变化,研究带马尔科夫链的随机最优控制问题是有实际意义的。
  相比于传统的扩散模型,带马尔科夫链模型主要具有以下两方面的优势。首先,在理论方面,模型所含有的马尔科夫链可以更加直接地描述影响系统的行为中那些不频繁变化但是对系统长期趋势有重要影响的因素和事件。例如上面的股票市场的例子,牛市与熊市的市场参数(收益率和波动率等)明显不同,传统的扩散模型就不能方便有效的反映这一现象,当引入马尔科夫链以后,就可以使得股票价格的走势和波动情况依赖于市场行情的变化。此外,在处理期权定价,证券投资组合等问题中,带马尔科夫链的模型也有广泛应用。然后,在数值计算方面,带马尔科夫链模型也具有优势。首先,当我们使用动态规划原理时,带马尔科夫链模型的随机最优控制问题具有简明的Hamilton-Jacobi-Bellman(HJB)方程,方便我们使用一些有效便捷的科学计算方法来处理。其次,在做计算处理时,带马尔科夫链模型只要求有限数据输入。仍以股票市场为例,我们只需要输入在不同状态下股票的收益率和波动率,以及马尔科夫链的转移速率矩阵。由此可见,带马尔科夫链的随机最优控制问题具有理论和计算两方面的优势。
  下面我们给出本文的主要内容和结构框架。
  在第一章中,我们研究了带马尔科夫链模型下的最优转换控制问题,及其在股票交易问题中的应用。我们首先得到了该问题的动态规划原理以及HJB方程,然后证明了问题的值函数是对应HJB方程的唯一粘性解。同时,最优转换策略也由HJB方程的障碍部分给出,决定了在何时和往何处转换是最优的。当马尔科夫链具有双时间尺度结构时,我们证明了相应的收敛性结果。最后,我们将在最优转换控制的框架下来研究股票交易问题,并利用数值计算给出了最优交易规则和最优收益。特别地,我们将利用双时间尺度马尔科夫链来模拟股票市场中的长期趋势和短期趋势,收敛性结果也被验证。
  在第二章中,我们研究了随机离开时间和不完备市场下的连续时间均值-方差证券投资组合选择问题。我们首先将均值-方差问题构造成为一个带终端期望限制的线性二次最优控制问题。然后,由随机线性二次控制理论,我们的均值-方差问题就会归结为两个倒向随机微分方程(BSDEs)的可解性问题。其中一个是随机Riccati方程,另一个是辅助BSDE。我们将使用BMO-鞅理论来给出一个对于上述两个BSDEs可解性的简洁有效的证明。随后,我们利用这两个倒向方程的解,给出了最优投资组合的线性反馈形式。
  在第三章中,我们研究了带马尔科夫链和泊松跳的正倒向随机系统的最优控制问题。首先利用对偶方法,建立了最优控制的充分性随机最大值原理。接下来,我们研究了它与动态规划原理的关系,建立了伴随过程、一般哈密顿函数以及值函数之间的关系。最后,我们将得到的理论结果应用于一个带终端财富限制的现金流估值问题,并利用马尔科夫链的性质和一些分析技术得到了显式的最优策略。
  在第四章中,我们研究了带马尔科夫链的超前-延迟正倒向随机系统的最优控制问题的必要性最大值原理。我们先由凸变分方法给出了系统的变分方程,以及一些相关估计,这就使得我们可以推导出变分不等式。然后,我们给出了相应的伴随方程。根据变分不等式的形式,以及伴随方程,我们就得到了必要性最大值原理。同时,我们还证明了,在某些凸性假设下,必要性最大值原理也会变成充分性条件。最后,我们研究了一类递归效用投资-消费选择问题,并给出了显式的最优消费率。
  接下来,我们给出本篇论文的主要结论。
  1.带马尔科夫链模型下的最优转换问题及其在股票交易问题中的应用
  记(Ω,F,P)是一个概率空间,上面定义了一个标准的1-维的布朗运动B(t),t≥0和一个马尔科夫链α(t),t≥0。假设B(·)和α(·)是独立的。马尔科夫链取值于一个有限的状态空间M={1,…,M}。记Q=(λpq)p,q∈M是α(·)的生成元。记{Ft}t≥0是由B(·)和α(·)生成的并完备化的信息族。
  考虑一个1-维的混合扩散(αp(·),Xp,x(·)),其初始状态是(p,x)∈M×R{ dXp,x(t)=b(αp(t),Xp,x(t))dt+σ(αp(t),Xp,x(t))dB(t), t≥0,Xp,x(0=x),αp(0)=p.
  记N={1,…,N}是转换控制的状态集合。一个转换控制定义为一序列停时-状态对(((Τ))n,ξn)n≥1,其中((Τ))n是一列递增的停时,ξn是F((Τ))n-可测的随机变量,取值于N,记转换控制过程为Ii(t)=i1[0,((Τ))1)(t)+∑n≥1ξn1[((Τ))n,((Τ))n+1)(t),t≥0,其中1A是集合A的示性函数。
  总回报函数定义为J(i,p,x,Ii(·))=E[∫∞0 e-ρtf(Ii(t),αp(t),Xp,x(t))dt-∞∑n=1e-ρ((Τ))ngξn-1,ξn],其中ρ>0是折现因子。我们记Ai是全体初始状态为i的容许转换控制的全体。
  我们定义值函数为v(i,p,x)=sup Ii(·)∈Ai J(i,p,x,Ii(·)),(0.0.1)我们也记v(i,p,x)为vi,p(x)。下面的定理给出了带马尔科夫链模型下的最优转换问题的动态规划原理。
  定理0.1.假设(H1.1)-(H1.3),则对任意的(ip,x)∈N×M×R和停时θ,我们有v(i,p,x)=sup Ii(·)∈Ai E[∫θ0 e-ρtf(Ii(t),αp(t),Xp,x(t))dt+e-ρθv(Ii(θ),αp(θ),Xp.x(θ))-∑((Τ))n≤θ e-p((Τ))ngξn-1,ξn].问题对应的HJB方程(或称变分不等式系统)如下min{ρvi,p(x)-Lpvi,p(x)-f(i,p,x)-∑q≠pλpq(vi,q(x)-vi,p(x)),vi,p(x)-max j≠i{vj,p(x)-gij}}=0,(0.02)其中Lp=b(p,x)(a)/(ax)+1/2σ2(p,x)(a)2/(a)x2。
  下面的两个定理给出了关于方程(0.0.2)的粘性解的存在唯一性结果。
  定理0.2.在假设(H1.1)-(H1.3)下,由(0.0.1)定义的值函数vi,p(x)是HJB方程(0.0.2)的粘性解。
  定理0.3.在假设(H1.1)-(H1.3)下,记ui,p(x)(相应地,vi,p(x))是(0.0.2)的一个粘性下解(相应地,上解)且满足线性增长条件,则我们有ui,p(x)≤vi,p(x)。
  然后,我们假设马尔科夫链αε(·)具有双时间尺度结构,其生成元Qε=(λεpq)结构为Qε=1/ε(Q)+(Q),其中,(Q)=(λpq),(Q)=((λ)pq)。假设αε(·)的状态空间是M=M1∪…∪ML,其中Mk={sk1,…,skmk},k=1,…,L,M=m1+…+mL。此外,(Q)结构为{(Q)1…(Q)L}使(Q)k对于Mk也是一个生成元,对任意的k=1,…,L。对应的极限变分不等式系统是min{ρvi,k(x)-(L)kvi,k(x)-(f)(i,k,x)-∑q≠k(λ)kq(vi,q(x)-vi,k(x)),vi,k(x)-max{vj,k(x)-gij}=0,(0.0.3)其中,(L)k=(b)(k,x)(a)/(a)x+1/2(σ)2(k,x)(a)2/(a)x2。
  定理0.4.对任意k=1,…,L和l=1,…,mk,我们有vε i,skl(x)→(v)i,k(x)。此外,(v)i,k(x)是极限变分不等式系统(0.0.3)的唯一粘性解。
  然后我们将理论结果应用于股票交易问题。股票价格为{dXp,x(t)=b(αp(t))Xp,x(t)dt+σ(αp(t))Xp,x(t)dB(t), t≥0,Xp,x(0)=x,αp(0)=p,(0.0.4)其中,αp(·)是一个马尔科夫链,取值于M={1,2,…,M},x和p是股票价格和马尔科夫链的初始状态。在这里,b(p),p∈M,是期望回报率,σ(p),p∈M代表股票的波动率。
  记{((Τ))n}n≥1是一列递增的停时序列,代表转换控制:在((Τ))n时刻进行买卖股票。我们取N={0,1}。在这里,状态0代表不持有股票,状态1代表持有1份股票。如果i=0(初始时刻不持有股票),那么交易员在((Τ))1时刻买入股票,然后在((Τ))2时刻卖出,再在((Τ))3时刻买入股票,然后在((Τ))4时刻卖出,依此类推。另一方面,如果i=1(初始时刻有1份股票),那么交易员在((Τ))1时刻先将股票卖出,然后在(Τ)2时刻买入,再在(Τ)3时刻卖出,依此类推。记股票的交易策略(从状态i∈N开始)为Ii(t)=i1[0,(Τ)1)(t)+∑n≥1ξn1[(Τ)n,(Τ)n+1)(t),t≥0,并记Ai为交易策略的全体。
  目标是选择一列{(Τ)n}n≥1,最大化收益J(i,p,x,Ii(·))={E[e-ρ(Τ)2(X((Τ)2)-K)-e-ρ(Τ)1(X((Τ)1)+K)+ e-ρ(Τ)4(X((Τ)4)-K)-e-ρ(Τ)3(X((Τ)3)+K)+…], i=0,E[e-ρ(Τ)1(X((Τ)1)-K)+ e-ρ(Τ)3(X((Τ)3)-K)-e-ρ(Τ)2(X((Τ)2)+K)+…], i=1,(0.0.5)其中K是交易费。此外,定义v(i,p,x)=supIi(·)∈AiJ(i,p,x,Ii(·))。
  我们考虑一个新问题,具有与(0.0.4)相同的动态,不过要最大化一个新目标(J)(i,p,x,Ii(·))={Ee-ρ(Τ)2(X((Τ)2)-K)-e-ρ(Τ)1(X((Τ)1)+K)+e-ρ(Τ)4(X((Τ)4)-K)-e-ρ(Τ)3(X((Τ)3)+K)+…], i=0,E[e-ρ(Τ)1(X((Τ)1)-K)-(X(0)+K)+e-ρ(Τ)3(X((Τ)3)-K)-e-ρ(Τ)2(X((Τ)2)+K)+…], i=1,(0.0.6)并定义(v)(i,p,x)=supIi(·)∈Ai(J)(i p,x,Ii(·))。
  注意到新问题(0.0.6)与原始问题(0.0.5)具有相同的最优交易策略。此外,v(0,p,x)=(v)(0,p,x), v(1,p,x)=(v)(1,p,x)+x+K.经过一个变换,我们就会看到目标泛函(0.0.6)可以写成(J)(i,p,x,Ii(·))=E[∫∞0 e-ρtf(Ii(t),αp(t),Xp,x(t))dt-∞∑n=1 e-ρ(Τ)ngξn-1,ξn].从而,对应于现在的情形,变分不等式(0.0.2)具有下面的形式min{ρ(v)i,p(x)-b(p)x(a)/(a)x(v)i,p(x)-1/2σ2(p)x2(a)2/(a)x2(v)i,p(x)-f(i,p,x)-∑q≠pλpq((v)i,q(x)-(v)i,p(x)),(v)i,p(x)-(v)i,p(x)+gij}=0,基于此,我们就可以计算值函数和最优股票交易规则。
  2.随机离开时间和不完备市场下的均值-方差证券投资组合问题
  假设T>0是一个有限时间区间的终点。(Ω,A,{Ft}t∈[0,T],P)是一个完备的概率空间。记(B)(t)=(B(t)',W(t)')'=(B1(t),…,Bm(t),W1(t),…,Wd(t))',m≥1,d≥0是一个定义在这个概率空间上的(m+d)-维的标准布朗运动。我们进一步的假设信息族{Ft}t∈[0,T]满足FT(∈) A,且是由(B)(t)生成的。
  考虑一个投资人在时间t投资自己总资产x(t)中的ui(t)于第i种证券,i=0,1,…,m。那么,投资人的资产满足下面的SDE,其中x0是初始资产:{dx(t)={r(t)x(t)+b(t)u(t)}dt+u(t)'σ(t)dB(t), t∈[0,T],x(0)=x0>0,其中b(t)=(μ1(t)-r(t),…,μm(t)-r(t))。我们称一个投资组合u(t)是容许的,如果u(t)∈U:=L2F(0,T;Rm)。
  假设投资人的离开时间(Τ)-是一个关于A可测的正的随机变量,其中A有可能比F(Τ)大。假设投资期限是T,在此之后投资人就不可以继续进行投资。因此,投资人的实际离开时间就是T∧(Τ)。他的目标是,对于一个给定的z∈R,寻找一个终端收益满足E[x(T∧(Τ))]=z的容许控制u(t),使得终端风险(用终端收益的方差来表示)Var[x(T∧(Τ))]=E[x(T∧(Τ))-E[x(T∧(Τ)-)]]2=E[x(T∧(Τ))-z]2最小化。
  利用分离方法和一些随机分析技术,我们将这个随机离开时间和不完备市场下的均值-方差问题构造成如下的一个带限制的随机线性二次控制问题。
  定义0.1.假设(H2.1),(H2.2),和(H2.3)成立,则随机离开时间和不完备市场下的均值-方差证券投资组合问题被构造成为一个以z∈R为参数的受约束的随机线性二次最优控制问题:{最小化JMV(u(·))=E[∫T0 a(s)(x(s)-z)2ds+(1-F(T))(x(T)-z)2],对应于{J1(u(·))=E[∫T0 a(s)x(s)ds+(1-F(T))x(T)]=z,(x(·),u(·))是容许的.(0.0.7)
  注意到我们的均值-方差问题带有限制J1(u(·))=z,在解决了可行性问题以后,我们使用拉格朗日乘子法来处理这个限制。对于所有的λ∈R,我们定义J(u(·),λ)=JMV(u(·))+2λ(J1(u(·))-z)=E[∫T0 a(s)(x(s)+(λ-z))2ds+(1-F(T))(x(T)+(λ-z))2]-λ2.第一个目标是处理下面的这个以λ为参数的不带限制的问题:{最小化J(u(·),λ),对应于(x(·),u(·))是容许的.(0.0.8)这是一个标准的随机线性二次最优控制问题,
  我们引入下面的两个BSDEs:{dp=[-2a+(-2r+|θ|2)p+2θ'Λ1+Λ'1Λ1/p] dt+Λ'1dB+Λ'2dW,p(T)=2(1-F(T)),p(t)>0, t∈[0,T],(0.0.9)和{dh=[-2a/p+(r+2a/p)h+θ'η1-Λ'2/pη2]dt+η'1dB+η'2dW,h(T)=1,t∈[0,T].(0.0.10)(0.0.9)就是所谓的随机Riccati方程(SRE),(0.0.10)是辅助BSDE。我们将使用BMO-鞅理论来证明上述两个方程的可解性,即以下两个定理。
  定理0.5.假设(H2.1)-(H2.3)成立。则SRE(0.0.9)有解(p,Λ)∈L∞F(Ω;C(0,T;R))×L2F(0,T;Rm+d),且满足k≤p≤K,其中K>k>0。此外,∫t0Λ(s)'d(B)(s)是一个BMO-鞅。
  定理0.6.假设(H2.1)-(H2.3)。给定一个SRE(0.0.9)的解(p,Λ)N,则BSDE(0.0.10)存在唯一解(h,η)∈L2F(Ω;C(0,T;R)×L2F(0,T; Rm+d)。而且,对于所有的t∈[0,T],我们有0<h(t)≤1。此外,如果r(t)>0,a.e.t∈[0,T],则对所有的t∈[0,1),有0<h(t)<1。
  确定了上述两个BSDEs的可解性后,就可以解出不受限问题(0.0.8)。最后,根据不受限问题的解,就能给出原始问题(0.0.7)的解。可以看出,最优的投资组合是一个线性状态反馈的形式,终端最小风险Va4[x*(T∧(Τ)-)]关于终端财富z是一个二次函数。
  定理0.7.假设(H2.1)-(H2.3)和条件(2.3.2)成立。则我们有1/2p(0)h2(0)+Δ-1<0.此外,对应于z的一个最优投资组合(具有反馈控制的形式),由下式给出u*(t)=uλ*(t)=-(σ(t)σ(t)')-1[(b(t)'+σ(t)Λ1(t)/p(t))(xλ*(t)+(λ*-z)h(t))+(λ*-z)σ(t)η1(t)], t∈(0,T],其中λ*-z=2z-p(0)h(0)x0/p(0)h2(0)+2Δ-2.最优的财富过程x*(t)=xλ*(t), t∈[0,T],由方程(2.5.1)的解给出,对应于uλ*(t)。此外,在满足限制E[x(T∧(Τ))]=z的所有的财富过程x(·)中,终端财富方差Varx(T∧(Τ))]的最优值是Var[x*(T∧(Τ))]=p(0)h2(0)+2△/2-2△-p(0)h2(0)(z-p(0)h(0)/p(0)h2(0)+2△x0)2+p(0)△/p(0)h2(0)+2Δx20.
  3.带马尔科夫链和泊松跳的正倒向系统的最大值原理及其在金融中的应用
  记(Ω,F,{Ft}t∈[0,T],P)是一个完备的概率空间,上面定义了一个标准的1-维的布朗运动,一个连续时间马尔科夫链,和一个泊松随机测度。马尔科夫链α(t)的状态空间是S={α1,α2,...,αD},其中D∈N,αi∈RD,且第j个分量是δij,对于每一个i,j=1,2,...,D。
  对应于控制u(t)∈U∈R的状态过程(X(t),Y(t),Z(t),(Z)(t,e),(Z)(t))∈R4×RD由下面的FBSDE给出:{dX(t)=b(t,X(t),u(t),α(t))dt+σ(t,X(t),u(t),α(t))dB(t)+∫ε(σ)(t,X(t),u(t),α(t),e)(N)(dt,de)+<(σ)(t,X(t),u(t),α(t)),d(Φ)(t)>,-dY(t)=f(t,Θ(t),u(t),α(t))dt-Z(t)dB(t)-∫ε(Z)(t,e)(N)(dt,de)-,X(0)=x0, Y(T)=μX(T),(0.0.11)其中,μ∈R是一个给定的常数,b,σ,(σ),(σ),f是给定的具有合适维数的函数。在这里,为了方便起见,我们记Θ(t)=(X(t),Y(t),Z(t))。
  考虑如下的评价指标:J(u(·))=E[∫T0 l(t,Θ(t),u(t),α(t))dt+g(X(T),α(T))+h(Y(0)),(0.0.12)其中l,g,h是给定的具有合适维数的函数。我们的最优控制问题是:寻找一个容许控制u*(·)∈(U)使得J(u*(·))=infu(·)∈(U) J(u(·))。
  记θ代表(x,y,z),记R代表所有的函数r:ε(→)R。定义哈密顿函数H:[0,T]×R3×U×S× R3×R×RD(→)R为H(t,θ,u,αi,φ,ψ,ψ,(ψ),(ψ)=b(t,x,u,αi)ψ+σ(t,x,u,αi)ψ+∫ε(σ)(t,x,u,αi,e)(ψ )v(de)+∑Dj=1(σ)j(t,x,u,αi)(ψ)jλij+f(t,θ,u,αi)φ+l(t,θ,u,αi)。我们假设哈密顿函数H关于θ是可微的。在引入伴随方程(3.2.3)后,我们就可以得到下面的充分性随机最大值原理。
  定理0.8.记u*∈(U),对应的方程(0.0.11)的解是(X*,Y*,Z*,(Z)*,(Z)*),假设伴随方程(3.2.3)的解(φ,ψ*,ψ*,(ψ)*,(ψ)*)使得对所有的u∈(U),有E∫T0(X(t)-X*(t))2[ψ*(t)2+∫ε(ψ)*(t,e)2v(de)+(ψ)*(t)'Diag(λ(t))(ψ)*(t)]dt<∞,E∫T0(Y(t)-Y*(t))2[(a)f/(a)z(t,Θ*,u*,α)2+(a)l/(a)z(t,Θ*,u*,α)2]dt<∞,E∫T0φ*(t)2[Z(t)2+∫ε(Z)(t,e)2v(de)+(Z)(t)'Diag(λ(t))(Z)(t)]dt<∞,E∫T0ψ*(t)2[σ(t,X,u,α)2+∫ε(σ)(t,X,u,α,e)2v(de)+(σ)(t,X, u,α)'Diag(λ(t))(σ)(t,X,u,α)dt<∞.
  为了符号方便,我们记H(t,θ,u)=H(t,θ,u,α(t),φ*(t),ψ*(t),ψ*(t),(ψ)*(t,e),(ψ)*(t))。此外,我们假设下面的条件成立
  条件1.对于所有的t∈[0,T],H(t,Θ*(t),u*(t))=infu∈UH(t,Θ*(t),u)。
  条件2.对于每一个固定的t∈[0,T],H(t,θ)=infu∈UH(t,θ,u)存在并且是一个关于θ的凸函数。
  条件3.函数g(x,αi)和h(y)是凸的,对于每一个αi,i=1,2,…,D。
  则u*是一个最优控制,(X*,Y*,Z*,(Z)*,(Z)*)是对应的最优状态过程。
  接下来,我们将建立最大值原理与动态规划原理之间的关系。我们首先将代价泛函(0.0.12)简化为J(u(·))=Y(0),并记J(t,x,αi;u(·))=Y(t),其中(t,x,αi)代表初始时间和初始状态,即X(t)=x,α(t)=αi。并且,定义V(t,x,αi)=inf u(·)∈u J(t,x,αi;u(·)).我们得到值函数V(t,x,αi)满足下面的HJB方程:{0=-(a)v/(a)t(t,x,αi)+sup u∈U G(t,x,-v(t,x,αi),-(a)v/(a)x(t,x,αi),-(a)2v/(a)x2(t,x,αi),u,αi),μx=V(T,x,αi),其中,对于每一个αi,关于v∈C1,2([0,T]×R)的一般哈密顿函数G定义为(3.4.2)。则我们有下面的定理。
  定理0.9.假设V(t,x,αi)∈C1,2([0,T]×R),对于每一个αi∈S。记u*是最优控制,(X*,Y*,Z*,(Z)*,(Z)*)是相应的最优状态过程。则对于所有的s∈[t,T],我们有(a)V/(a)s(s,X*,α)=G(s,X*,-V(s,X*,α),-(a)V/(a)x(s,X*,α),-(a)2V/(a)x2(s,X*,α),u*,α).此外,如果V(t,x,αi)∈C1,3([0,T]×R),我们定义下列过程:φ*(s)=exp{∫s t[(a)f/(a)y(r,Θ*,u*,α)-1/2(a)f/(a)z(r,Θ*,u*,α)2]dr+∫s t(a)f/(a)z(r,Θ*,u*,α)dB},ψ*(s)=(aV)/(a)x(s,X*,α)φ*(s),Ψ*(s)=[(a)2V/(a)x2(s,X*,α)σ(s,X*,u*,α)+(a)V/(a)x(s,X*,α)(a)f/(a)z(s,Θ*,u*,α)]φ*(s),(Ψ)*(s,e)=[(a)V/(a)x(s,X*+(σ)(s,u*,α,e),α)-(a)V/(a)x(s,X*,α)]φ*(s),(ψ)*j(s)=[(a)V/(a)x(s,X*+(σ)j(s,u*,α),αj)-(a)V/(a)x(s,X*,α)]φ*(s),j=1,2,...,D.则(φ*(s),ψ*(s),ψ*(s),(ψ)*(s,e),(ψ)*(s))就是伴随过程且满足FBSDE(3.2.3)。
  最后,我们应用最大值原理解决一个带马尔科夫链和泊松跳的金融市场中的带终端财富限制的现金流估值问题。由拉格朗日乘子法,我们将问题构造如下。最小化:J(c(·),u(·))=E[-∫T0 e-∫t0β(s,α(s))dsU(c(t)X(t))dt+δ/2(X(T)-d)2+θ(Y(0)-x0)],其中,c(t)是委托人的提取回报率,作为控制的一部分。代理人的财富过程X(t)由下面的SDE给出{dX(t)=[r(t,α(t))X(t)+Π(t,α(t))u(t)]dt+σ(t,α(t))u(t)dB(t)+∫ε(σ)(t,α(t),e)u(t)(N)(dt,de),X(0)=x0,其中,u(t)是代理人的投资策略,作为控制的另一部分。委托人的效用Y(t)由下面的倒向随机微分方程给出{-dY(t)=[k(t,α(t))Y(t)-c(t)X(t)]dt-Z(t)dB(t)-∫ε(Z)(t,e)(N)(dt,de)-<(Z)(t),d(φ)(t)>,Y(T)=0.利用马尔科夫链的性质和鞅表示定理,我们可以显式地解出上述问题的最优策略,即下面的定理。
  定理0.10.带终端财富限制的现金流估值问题(3.5.3)的最优控制策略由下面给出:c*(t)=θ*1/γ-1e1/1-γ∫t0[k(s,α(s))-β(s,α(s))]dsX*(t)-1,u*(t)=-Λ(t,α(t))-1Π(t,α(t))[X*(t)+q(t,α(t))/p(t,α(t))],其中θ*由(3.5.23)给出,p(t,α(t))和q(t,α(t))分别由(3.5.17)和(3.5.18)给出。
  4.带马尔科夫链的正倒向超前-延迟系统的随机最大值原理
  记(Ω,F,P)是一个概率空间。T>0是一个有限时间区间的终点。{Bt}0≤t≤T是一个1-维布朗运动,{αt}0≤t≤T是一个有限状态马尔科夫链,状态空间记为I={1,2,…,k}。假设B和α是相互独立的。马尔科夫链的转移速率记为λ(i,j)。假设λ(i,j)是非负的和一致有界的,并且λ(i,i)=-∑j≠iλ(i,j)。记{Ft}0≤t≤T是由{Bt,αt}0≤t≤T生成的自然信息族,并包含F中所有的P-零测集。
  我们首先建立下面的带马尔科夫链的超前的BSDE的解的存在唯一性:{-dYt=g(t,Yt,Yt+δ,Zt,Zt+δ,Vt)dt-ZtdBt-∑j∈IVt(j)d(V)t(j), t∈[0,T),(0.0.13)Yt=at, Zt=bt, t∈[T,T+δ],其中,终端条件at∈L2F(T,T+δ;R),bt∈L2F(T,T+δ;R)。
  定理0.11.在假设(H4.1)和(H4.2)下,BSDE(0.0.13)存在唯一解(Yt,Zt,Vt)∈L2F(0,T+δ;R)×L2F(0,T+δ;R)×L2(P; R)。
  我们考虑下面的最优控制问题,控制系统由一个正倒向方程给出。{dXt=b(t,αt,Xt,Xt-δ,vt,vt-δ)dt+σ(t,αt,Xt,Xt-δ,vt,vt-δ)dBt,-dYt=g(t,αt,Xt,Xt-δ,Yt,EFt[Yt+δ],Zt,EFt[Zt+δ],Wtnt,vt,vt-δ)dt-ZtdBt-∑j∈I Wt(j)d(V)t(j), t∈[0,T],X t=x0(t), vt=v0(t), t∈[-δ,0],YT=ψ(XT),ZT=bT, Yt=at, Zt=bt, t∈(T,T+δ],其中Wtnt=(Wt(1)nt(1),...,Wt(k)nt(k)),x0(t),v0(t)是确定性的函数。
  在上面,vt是一个Ft-适应的控制过程,取值于U,且U(C)R是一个非空的凸集。记U为容许控制的集合,其中容许控制是指取值于凸集U并且满足E[∫T0|vt|2dt|<∞。定义代价泛函如下:J(vt)=E[∫T0 l(t,αt,Xt,Xt-δ,Yt,Zt,Wtnt,vt,vt-δ)dt+h(XT)+r(Y0)],(0.0.14)其中l,h,r是可测函数。
  我们的最优控制问题的目标是,在容许控制集U中,最大化泛函指标(0.0.14)。能够最大化(0.0.14)的控制ut被称为是最优控制。
  由变分方程(4.3.1),以及定理4.2中的估计,我们可以建立下面的变分不等式。
  定理0.12.假设(H4.3)-(H4.5)成立,则我们有:E[∫T0(lxξt+ lxδξt-δ+lyηt+lzγt+∑j∈Ilw(j)Γt(j)nt(j)+lvv't+lvδv't-δ)dt+hx(X T)ξT+ry(y0)η0]≤0.
  引入伴随方程(4.3.5)后,定义哈密顿函数H:[0,T]×I×R×R×R×L2(Fr;R)×R×L2(F(r); R)×L2((P); R)×U×U×R×R×R(→)R如下H(t,j,x,xδ,y,Yδ,z,zδ,w,v,vδ,p,k,q)=pb(t,j,x,xδ,v,vδ)+kσ(t,j,x,xδ,v,vδ)-qg(t,j,x,xδ,y,yδ,z,zδ,wnt,v,vδ)+l(t,j,x,xδ,y,z,wnt,v,vδ),其中r,(r)∈[t,T]。我们可以得到下面的随机最大值原理。
  定理0.13.假设(H4.3)-(H4.5),记ut是一个最优控制,(Xt,Yt,Zt,Wt)是对应的状态过程。(qt,pt,kt,Λt)是伴随方程(4.3.5)的唯一解。则对任意的v∈U,我们有(Hv+EFt[(Hvδ|t+δ)])(v-ut)≤0, a.e.,a.s.(0.0.15)
  然后,我们假设一个额外的凸性条件,来获得一个关于最优控制的充分性条件。
  定理0.14.假设ut∈U。记(Xt,Yt,Zt,Wt)是对应的状态过程,(qt, pt,kt,Λt)是伴随方程(4.3.5)的解。如果假设(H4.3)-(H4.6)和方程(0.0.15)对于ut成立,则ut是一个最优控制。
  最后,我们研究一个递归效用下的投资-消费问题。应用随机最大值原理,我们得到了显式的最优消费率。考虑一个带马尔科夫链和延迟的随机动态:{ dXt=(b(αt)Xt-δ-ct)dt+σ(αt)Xt-δdBt, t∈[0,T],X0=x0(t), ct=c0(t), t∈[-δ,0],α0=i.其中,消费过程ct是一个Ft-适应的非负的过程,满足E[∫T0|ct|2dt]<∞。记(U)代表所有消费过程的集合。在我们的投资-消费问题中,假设投资人将会选取U中的一个消费过程去最大化他的效用。考虑下面的递归效用,由一个带马尔科夫链的BSDE来描述:{-dYt=(U(t,ct,ω)+β(αt)Xt+γ(αt)Xt-δ+m(αt)Yt+n(αt)Zt)dt-ZtdBt-∑j∈IWt(j)dVt(j),t∈[0,T],Y(Τ)=ψ(αt)X(Τ),其中U(t,c,w):[0,T]×R+×Ω(→)R是一个给定的满足一定条件的效用函数。
  我们想要找到一个消费率(c)t,使得Y0((c)t)=sup ct∈(U) Y0(ct).利用随机最大值原理,通过最大化哈密顿函数,再结合一些BSDE的性质,我们可以得到候选的最优消费率(c)t可以由下式给出:(c)t=I(t,-pt/qt,ω), t∈[0,T].(0.0.16)容易验证假设(H4.3)-(H4.6)被满足,所以我们得到下面的结果。
  定理0.15.记(qt,pt,kt,Λt)是伴随方程(4.4.3)的解,假设(4.4.4)成立,则由定理0.14知,最优的消费率(c)t由(0.0.16)给出。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号