法律状态公告日
法律状态信息
法律状态
2017-02-08
授权
授权
2014-06-25
实质审查的生效 IPC(主分类):G06F19/10 申请日:20140305
实质审查的生效
2014-05-21
公开
公开
技术领域
本发明涉及生物信息技术领域,特别是指一种基于基因互作的植物生长预 测调控方法及系统。
背景技术
基因互作是指非等位基因之间通过相互作用影响同一性状表现的现象。在 自然界中,植物之间的交互作用以各种复杂的形式进行。长期以来,这些交互 作用被认为在塑造自然群落的结构和动态趋势中扮演着重要的角色。
近年来,大多数研究都采用生态和生理生态的方法描述物种间在时间和空 间维度上的互作,但这种方法无法通过基因互作推断植物过去的生长状况,预 测未来的生长趋势。
发明内容
本发明要解决的技术问题是如何提供一种基于基因互作的植物生长预测 调控方法及系统,能够通过基因互作推断植物过去的生长状况,预测植物务的 生长趋势,并对其进行调整。
为解决上述技术问题,本发明的实施例提供一种基于基因互作的植物生长 预测调控方法,该方法包括步骤:
获取样本数据,所述样本数据包括数量性状数据、空间距离数据、关键位 点数据、基因型数据和环境信息数据;
利用所述样本数据,根据调控样本自身对生长的贡献、周围样本对调控样 本生长的贡献及周围环境对调控样本生长的贡献建立样本生长预测方程;
利用最优化方法求解所述样本生长预测方程,得到最优预测参数;
利用所述最优预测参数、样本数据、样本生物量和环境信息数据生成所述 调控样本的最优调整方案;
根据所述最优调整方案,调整所述调控样本的生长环境。
优选的,所述步骤获取样本数据,所述样本数据包括数量性状数据、空间 距离数据、关键位点数据和基因型数据,包括:
所述数量性状数据包括所述调控样品在T个观测时刻的数量性状值,表 示为:
{yi,t},i=1,2,...,n;t=1,2,...,T
其中,n为所有样本数量,i表示调控样本,t为观测时刻;
所述空间距离数据包括调控样本与周围样本间的距离,表示为:
{di,j},i=1,2,...,n;j=1,2,...,n
其中,j表示周围样本;
所述关键位点数据为所述调控样本的关键位点数据表示为:
{gk},k=1,2,...,K;
其中,K为关键位点数量;
所述基因型数据包括关键位点的基因数据,表示为:
{qi,k},i=1,2,...,n;k=1,2,...,K
所述环境信息数据表示为:
{vi,w},i=1,2,...,n;w=1,2,...,W
其中,W为环境因素影响的量。
优选的,所述步骤利用所述样本数据,根据调控样本自身对生长的贡献、 周围样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本 生长预测方程,包括:
利用所述样本数据,获取调控样本自身对生长的贡献参数,表示为:
{αk,g},k=1,2,...,K;g=0,1,2
获取周围样本对调控样本生长的贡献参数,表示为:
{βk,g,m,h},k=1,2,...,K;g=0,1,2;m=1,2,...,K;h=0,1,2
其中,m为所述周围样本的关键位点数量,h为所述周围样本的关键位点 数据;
获取环境因素对样本生长的贡献参数,表示为:
{γw},w=1,2,...,W
选取所述调控样本周围对样本生长产生直接影响的影响样本,利用所述样 本数据,根据调控样本自身对生长的贡献、影响样本对调控样本生长的贡献及 环境因素对样本生长的贡献建立样本生长预测方程,表示为:
其中,sj为影响样本,j=ni为影响样本的序号。
优选的,所述步骤利用最优化方法求解所述样本生长预测方程,得到最优 预测参数,包括:
设定初始边界条件;
设定参数;
利用所述初始边界条件和设定的参数通过所述样本生长预测方程得到数 量性状理论值;
计算数量性状理论值对实际测量数据的适应度;
依据所述适应度选择最优预测参数。
优选的,所述步骤利用所述初始边界条件和设定的参数通过所述样本生长 预测方程得到数量性状理论值,包括:
设定步长Δ;
获取样本在t0时刻的数量性状理值y(t0);
则调控样本在(t0+Δ)时刻的数量性状值表示为:
所述步骤计算数量性状理论值对实际测量数据的适应度,包括:
计算所有样本的数量性状值的标准差,表示为:
σ(t)=Ψ(y1,t,y2,t,...,yn,t)
基于正态分布,利用所述数量性状值的标准差,获得调控样本的数量性状 值yi,t的概率为:
则得到数量性状理论值对应的参数组Θ在调控样本上的适应度为:
所述参数组Θ在所有样本上的适应度为:
所述步骤依据所述适应度选择最优预测参数,包括:
选取适应度最大值的参数组作为最优预测参数,表示为:
优选的,所述步骤利用所述最优预测参数、样本数据、样本生物量和环境 信息数据生成所述调控样本的最优调整方案,包括:
所述调控样本基于所述最优预测参数的数量性状值表示为:
其中,所述Ω为所述样本所在的空间布局;
利用下式得到所述最优调整方案。
优选的,所述步骤根据所述最优调整方案,调整所述样本的生长环境,包 括:
所述生长环境包括:样本与周围植物的空间位置关系、周围植物的生长状 态、生长环境中的阳光、温度和水分中的至少一种。
优选的,所述方法还包括:
判断所述调控样本生长周期是否结束;
如果否,重复所述步骤利用所述最优预测参数、样本数据、样本生物量和 环境信息数据生成所述调控样本的最优调整方案至所述步骤根据所述最优调 整方案,调整所述调控样本的生长环境。
本发明还提供一种基于基因互作的植物生长预测调控系统,该系统包括:
数据获取模块,用于获取样本数据,所述样本数据包括数量性状数据、空 间距离数据、关键位点数据、基因型数据和环境信息数据;
方程生成模块,用于利用所述样本数据,根据调控样本自身对生长的贡献、 周围样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本 生长预测方程;
参数预测模块,用于利用最优化方法求解所述样本生长预测方程,得到最 优预测参数;
方案生成模块,用于利用所述最优预测参数、样本数据、样本生物量和环 境信息数据生成所述调控样本的最优调整方案;
环境调整模块,用于根据所述最优调整方案,调整所述调控样本的生长环 境。
优选的,所述方程生成模块包括:
第一参数获取单元,用于获取调控样本自身对生长的贡献参数;
第二参数获取单元,用于获取周围样本对调控样本生长的贡献参数;
第三参数获取单元,用于获取环境因素对样本生长的贡献参数;
方程生成单元,用于选取所述调控样本周围对样本生长产生直接影响的影 响样本,利用所述样本数据,根据调控样本自身对生长的贡献、影响样本对调 控样本生长的贡献及环境因素对样本生长的贡献建立样本生长预测方程,表示 为:
其中,sj为影响样本,j=ni为影响样本的序号。
本发明的上述技术方案的有益效果如下:
上述方案中,通过获取包括数量性状数据、空间距离数据、关键位点数 据、基因型数据和环境信息数据的样本数据,能够基于样本数据全面分析影响 样本生长的因素,利用所述样本数据,根据调控样本自身对生长的贡献、周围 样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本生长 预测方程,充分考虑了基因互作对样本生长的影响,利用最优化方法求解所述 样本生长预测方程,得到最优预测参数,生成最优调整方案,根据所述最优调 整方案,调整所述调控样本的生长环境,充分考虑到植物基因对调控样本生长 的影响,为样本生长的预测和调整提供了全面准确的最优调整方案,完善调控 样本的生长优化。
附图说明
图1为本发明的实施例基于基因互作的植物生长预测调控方法的流程图;
图2a为本发明的实施例基于基因互作的植物生长预测调控系统的结构 图;
图2b为本发明的实施例基于基因互作的植物生长预测调控系统的结构 图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附 图及具体实施例进行详细描述。
本发明针对现有技术无法通过基因互作推断植物过去的生长状况,预测未 来的生长趋势的问题,提供一种基于基因互作的植物生长预测调控方法。
如图1所示,本发明的实施例基于基因互作的植物生长预测调控方法的流 程图,所述方法包括:
步骤101:获取样本数据,所述样本数据包括数量性状数据、空间距离数 据、关键位点数据、基因型数据和环境信息数据。
其中,所述数量性状数据包括所述调控样品在T个观测时刻的数量性状 值即生物量,表示为:
{yi,t},i=1,2,...,n;t=1,2,...,T
其中,n为所有样本数量,i表示调控样本,t为观测时刻;
所述空间距离数据包括调控样本与周围样本间的距离,表示为:
{di,j},i=1,2,...,n;j=1,2,...,n
其中,j表示周围样本;
所述关键位点数据为所述调控样本的关键位点数据表示为:
{gk},k=1,2,...,K;
其中,K为关键位点数量;
可以通过已有成型的技术获取这些位点。当最终的数量性状在数值上有较 大差异时,可以采用QTL的技术发现这些位点;如果最终的数量性状相同或 差异不大,则可以采用Wu(2006)等的发现关键位点。每个关键位点有3种可 能的基因型,即QQ、Qq和qq这三种,而每一个个体在固定的位点上必居其 一。
所述基因型数据包括关键位点的基因数据,表示为:
{qi,k},i=1,2,...,n;k=1,2,...,K
其中,qi,k可以取、但只能取3个值0、1、2中的一个,分别表示QQ、 Qq和qq这三种基因型。
所述环境信息数据表示为:
{vi,w},i=1,2,...,n;w=1,2,...,W
其中,W为环境因素影响的量。
可以通过传感器来实现样本数据的实时获得,并由传感器将样本数据发送 回数据分析处理装置。
本实施例中,通过获取包括数量性状数据、空间距离数据、关键位点数据、 基因型数据和环境信息数据的样本数据,能够基于样本数据全面分析影响样本 生长的因素,样本数据可以由本领域技术人员根据对调控样本的影响因素和需 要进行设定,并不以本实施例为限定。
步骤102:利用所述样本数据,根据调控样本自身对生长的贡献、周围样 本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本生长预 测方程。
其中,建立样本生长预测方程的过程可以在数据分析处理装置中进行。
利用所述样本数据,获取调控样本自身对生长的贡献参数,表示为:
{αk,g},k=1,2,...,K;g=0,1,2
获取周围样本对调控样本生长的贡献参数,表示为:
{βk,g,m,h},k=1,2,...,K;g=0,1,2;m=1,2,...,K;h=0,1,2
其中,m为所述周围样本的关键位点数量,h为所述周围样本的关键位点 数据;
某个基因型所在个体因为另一个基因型的存在而造成对生长率的负贡献。 这组参数共有(3K)2-3K个。这是因为,当两个基因型不同时,彼此的影响程度是 不一样的;但当两个基因型相同时,彼此对生长率的影响是一致的。
当k和m相同,并且k和m相同时,
βk,g,m,h=βm,h,k,g.
除此之外,上述等式不成立。
获取环境因素对样本生长的贡献参数,表示为:
{γw},w=1,2,...,W
选取所述调控样本周围对样本生长产生直接影响的影响样本,对调控样本 产生直接影响的范围可以由本领域技术人员根据实际情况和需要进行设定,利 用所述样本数据,根据调控样本自身对生长的贡献、影响样本对调控样本生长 的贡献及环境因素对样本生长的贡献建立样本生长预测方程,表示为:
其中,sj为影响样本,j=ni为影响样本的序号。
本实施例中,利用所述样本数据,根据调控样本自身对生长的贡献、周围 样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本生长 预测方程,充分考虑了基因互作对样本生长的影响,本领域技术人员还可以根 据需要添加其他对调控样本生长影响的因素和参数,并不以本实施例为限定。
步骤103:利用最优化方法求解所述样本生长预测方程,得到最优预测参 数。
其中,样本生长预测方程组由于方程数量多、数量关系复杂,以及方程数 量n不确定等原因,几乎无法求得其解析解。因此,需要用数值解的方式对其 求解,其方法包括:
设定初始边界条件;
设定参数;
利用所述初始边界条件和设定的参数通过所述样本生长预测方程得到数 量性状理论值;
计算数量性状理论值对实际测量数据的适应度;
依据所述适应度选择最优预测参数。
步骤104:利用所述最优预测参数、样本数据、样本生物量和环境信息数 据生成所述调控样本的最优调整方案。
步骤105:根据所述最优调整方案,调整所述调控样本的生长环境。
其中,所述生长环境包括:样本与周围植物的空间位置关系、周围植物的 生长状态、生长环境中的阳光、温度和水分中的至少一种,本领域技术人员可 以根据最优调整方案进行自由调整。
首先,可以自动收集并记录由传感器传回所采集的信息,包括当前每个样 本个体的生物量、个体间的位置关系,以及环境因素等。然后,以当前时刻为 起始时刻,以当前状况为边界条件,重新进行环境变量的优化,得到环境因素 的理论输入值。
然后,把优化方案传回给控制器,通过控制器调节生长环境变量,时整个 的生长过程依照最优调整方案进行。
本实施例中,通过获取包括数量性状数据、空间距离数据、关键位点数据、 基因型数据和环境信息数据的样本数据,能够基于样本数据全面分析影响样本 生长的因素,利用所述样本数据,根据调控样本自身对生长的贡献、周围样本 对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本生长预测 方程,充分考虑了基因互作对样本生长的影响,利用最优化方法求解所述样本 生长预测方程,得到最优预测参数,生成最优调整方案,根据所述最优调整方 案,调整所述调控样本的生长环境,充分考虑到植物基因对调控样本生长的影 响,为样本生长的预测和调整提供了全面准确的最优调整方案,完善调控样本 的生长优化。
在步骤103中,设定初始边界条件为每个样本在第1个观察时刻的数量性 状数据既生物量。注意,这个量并不是测量得到的,而是在一定范围内设定的。
如果增加第0个观测时刻,让在第0时刻的每个植物个体的数量性状数据 生物量均为0,那么就无需设定边界条件。
参数设定包括:对调控样本自身对生长的贡献参数、调控样本生长的贡献 参数和环境因素对样本生长的贡献参数进行设定。在设定前,需要先给出每个 参数的范围。这需要从样本中统计获得。例如,可以将样本自身对生长的贡献 参数设定在0~0.5之间,将调控样本生长的贡献参数设定在0~0.1之间,环境 因素对样本生长的贡献参数在对环境因素做归一化处理后,将其值设定在0~1 之间。
所述步骤利用所述初始边界条件和设定的参数通过所述样本生长预测方 程得到数量性状理论值,包括:
设定步长Δ,步长越小,计算越精确,但计算量越大;步长越大,计算量 越小,但结果越不精确,本领域技术人员可以自行设定,优选的取Δ=10-6;
获取样本在t0时刻的数量性状理值y(t0);
则调控样本在(t0+Δ)时刻的数量性状值表示为:
所述步骤计算数量性状理论值对实际测量数据的适应度,包括:
计算所有样本的数量性状值的标准差,表示为:
σ(t)=Ψ(y1,t,y2,t,...,yn,t)
将样本生长预测方程得出的数量性状值作为方差,把已测数据看作随机变 量Yi,那么它满足如下正态分布:
Yi~N(yi(t),σ(t))
基于正态分布,利用所述数量性状值的标准差,获得调控样本的数量性状 值yi,t的概率为:
则得到数量性状理论值对应的参数组Θ在调控样本上的适应度为:
所述参数组Θ在所有样本上的适应度为:
所述步骤依据所述适应度选择最优预测参数,包括:
选取适应度最大值的参数组作为最优预测参数,表示为:
求解最优预测参数为一个高度非线性的优化问题,穷举求解又具有极高的 复杂度,而梯度法求解又容易陷入局部最优,因此,可以采用全局优化的手段, 进行优化求解。根据数据的特点,可以采用遗传算法,使得在可行的时间内得 到最优或次优的参数组即为最优预测参数。
在步骤104中,所述调控样本基于所述最优预测参数的数量性状值表示 为:
其中,所述Ω为所述样本所在的空间布局;
利用下式得到所述最优调整方案。
上式可以采用遗传算法等全局优化算法解决。但是,由于植物间的行距和 株距一般是固定的,上述优化问题中的n可以控制在8个(目标个体周围有一 层个体包围)就可以获得良好的效果。
优选的,所述基于基因互作的植物生长预测调控方法还包括:
步骤106:判断所述调控样本生长周期是否结束;
如果否,重复所述步骤104至步骤106。
如图2a所示,本发明的实施例基于基因互作的植物生长预测调控系统的 结构图,所述系统包括:
数据获取模块201,用于获取样本数据,所述样本数据包括数量性状数据、 空间距离数据、关键位点数据、基因型数据和环境信息数据。
方程生成模块202,用于利用所述样本数据,根据调控样本自身对生长的 贡献、周围样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立 样本生长预测方程。
参数预测模块203,用于利用最优化方法求解所述样本生长预测方程,得 到最优预测参数。
方案生成模块204,用于利用所述最优预测参数、样本数据、样本生物量 和环境信息数据生成所述调控样本的最优调整方案。
环境调整模块205,用于根据所述最优调整方案,调整所述调控样本的生 长环境。
如图2b所示,所述方程生成模块202包括:
第一参数获取单元206,用于获取调控样本自身对生长的贡献参数。
第二参数获取单元207,用于获取周围样本对调控样本生长的贡献参数。
第三参数获取单元208,用于获取环境因素对样本生长的贡献参数。
方程生成单元209,用于选取所述调控样本周围对样本生长产生直接影响 的影响样本,利用所述样本数据,根据调控样本自身对生长的贡献、影响样本 对调控样本生长的贡献及环境因素对样本生长的贡献建立样本生长预测方程, 表示为:
其中,sj为影响样本,j=ni为影响样本的序号。
需要说明的是:上述实施例提供的基于基因互作的植物生长预测调控系统 在实现上述功能时,仅以上述功能模块的划分进行举例说明,实际应用中,可 以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划 分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施 例提供的基于基因互作的植物生长预测调控系统与基于基因互作的植物生长 预测调控方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不 再赘述。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技 术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰, 这些改进和润饰也应视为本发明的保护范围。
机译: 预测模式选择方法,一种基于主边的方向性来减少预测模式候选的数量的装置,一种使用该方法的运动图像压缩方法,一种包括该装置的运动图像编码器以及一种编码器执行该方法的程序
机译: 一种基于离岸平台海洋信息的位置信息预测和位置信息学习预测系泊缆张力的系统
机译: 用于预测药物代谢的多核苷酸,包括NR1I2基因的单核苷酸多态性,一种试剂盒和一种基于其的药物代谢预测方法