首页> 中国专利> 一种基于基因互作的植物生长预测调控方法及系统

一种基于基因互作的植物生长预测调控方法及系统

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供一种基于基因互作的植物生长预测调控方法及系统，该方法包括步骤：获取样本数据；利用所述样本数据，根据调控样本自身对生长的贡献、周围样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本生长预测方程；利用最优化方法求解所述样本生长预测方程，得到最优预测参数；生成所述调控样本的最优调整方案；根据所述最优调整方案，调整所述调控样本的生长环境。上述方案中，能够基于样本数据全面分析影响样本生长的因素，利用所述样本数据，充分考虑了基因互作对样本生长的影响，充分考虑到植物基因对调控样本生长的影响，为样本生长的预测和调整提供了全面准确的最优调整方案，完善调控样本的生长优化。

著录项

公开/公告号CN103810403A

专利类型发明专利
公开/公告日2014-05-21

原文格式PDF
申请/专利权人北京林业大学;
展开▼

申请/专利号CN201410077450.0
发明设计人邬荣领;王建新;
展开▼

申请日2014-03-05
分类号G06F19/10;G06Q10/04;
代理机构北京市广友专利事务所有限责任公司;
代理人张仲波
地址 100083 北京市海淀区清华东路35号
入库时间 2024-02-20 00:11:30

法律信息

法律状态公告日

法律状态信息

法律状态
2017-02-08

授权

授权
2014-06-25

实质审查的生效 IPC(主分类):G06F19/10 申请日:20140305

实质审查的生效
2014-05-21

公开

公开

说明书

技术领域

本发明涉及生物信息技术领域，特别是指一种基于基因互作的植物生长预测调控方法及系统。

背景技术

基因互作是指非等位基因之间通过相互作用影响同一性状表现的现象。在自然界中，植物之间的交互作用以各种复杂的形式进行。长期以来，这些交互作用被认为在塑造自然群落的结构和动态趋势中扮演着重要的角色。

近年来，大多数研究都采用生态和生理生态的方法描述物种间在时间和空间维度上的互作，但这种方法无法通过基因互作推断植物过去的生长状况，预测未来的生长趋势。

发明内容

本发明要解决的技术问题是如何提供一种基于基因互作的植物生长预测调控方法及系统，能够通过基因互作推断植物过去的生长状况，预测植物务的生长趋势，并对其进行调整。

为解决上述技术问题，本发明的实施例提供一种基于基因互作的植物生长预测调控方法，该方法包括步骤：

获取样本数据，所述样本数据包括数量性状数据、空间距离数据、关键位点数据、基因型数据和环境信息数据；

利用所述样本数据，根据调控样本自身对生长的贡献、周围样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本生长预测方程；

利用最优化方法求解所述样本生长预测方程，得到最优预测参数；

利用所述最优预测参数、样本数据、样本生物量和环境信息数据生成所述调控样本的最优调整方案；

根据所述最优调整方案，调整所述调控样本的生长环境。

优选的，所述步骤获取样本数据，所述样本数据包括数量性状数据、空间距离数据、关键位点数据和基因型数据，包括：

所述数量性状数据包括所述调控样品在T个观测时刻的数量性状值，表示为：

{y_i,t},i=1,2,...,n;t=1,2,...,T

其中，n为所有样本数量，i表示调控样本，t为观测时刻；

所述空间距离数据包括调控样本与周围样本间的距离，表示为：

{d_i,j},i=1,2,...,n;j=1,2,...,n

其中，j表示周围样本；

所述关键位点数据为所述调控样本的关键位点数据表示为：

{g_k},k=1,2,...,K;

其中，K为关键位点数量；

所述基因型数据包括关键位点的基因数据，表示为：

{q_i,k},i=1,2,...,n;k=1,2,...,K

所述环境信息数据表示为：

{v_i,w},i=1,2,...,n;w=1,2,...,W

其中，W为环境因素影响的量。

优选的，所述步骤利用所述样本数据，根据调控样本自身对生长的贡献、周围样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本生长预测方程，包括：

利用所述样本数据，获取调控样本自身对生长的贡献参数，表示为：

{α_k,g},k=1,2,...,K;g=0,1,2

获取周围样本对调控样本生长的贡献参数，表示为：

{β_k,g,m,h},k=1,2,...,K;g=0,1,2;m=1,2,...,K;h=0,1,2

其中，m为所述周围样本的关键位点数量，h为所述周围样本的关键位点数据；

获取环境因素对样本生长的贡献参数，表示为：

{γ_w},w=1,2,...,W

选取所述调控样本周围对样本生长产生直接影响的影响样本，利用所述样本数据，根据调控样本自身对生长的贡献、影响样本对调控样本生长的贡献及环境因素对样本生长的贡献建立样本生长预测方程，表示为：

$\frac{{dy}_{i}}{dt} = \frac{1}{K} Σ_{k = 1}^{K} \partial_{k, q_{i, k}} - \frac{1}{K^{2}} Σ_{i = 1}^{k} Σ_{j = 1}^{n_{i}} \frac{β_{k, q_{i, k}} y_{s_{j}}}{1 + d_{i, s_{j}}} + \frac{1}{W} Σ_{w = 1}^{W} γ_{w} v_{i, w}, i = 1,2, . . ., n$

其中，s_j为影响样本，j=n_i为影响样本的序号。

优选的，所述步骤利用最优化方法求解所述样本生长预测方程，得到最优预测参数，包括：

设定初始边界条件；

设定参数；

利用所述初始边界条件和设定的参数通过所述样本生长预测方程得到数量性状理论值；

计算数量性状理论值对实际测量数据的适应度；

依据所述适应度选择最优预测参数。

优选的，所述步骤利用所述初始边界条件和设定的参数通过所述样本生长预测方程得到数量性状理论值，包括：

设定步长Δ；

获取样本在t₀时刻的数量性状理值y(t₀)；

则调控样本在(t₀+Δ)时刻的数量性状值表示为：

$y_{i} (t_{0} + Δ) = y_{i} (t_{0}) + (\frac{1}{K} Σ_{k = 1}^{K} \partial_{k, q_{i, k}} - \frac{1}{K^{2}} Σ_{i = 1}^{k} Σ_{j = 1}^{n_{i}} \frac{β_{k, q_{i, k}} y_{s_{j}} (t_{0})}{1 + d_{i, s_{j}}} + \frac{1}{W} Σ_{w = 1}^{W} γ_{w} v_{iw}) Δ$

所述步骤计算数量性状理论值对实际测量数据的适应度，包括：

计算所有样本的数量性状值的标准差，表示为：

σ(t)=Ψ(y_1,t,y_2,t,...,y_n,t)

基于正态分布，利用所述数量性状值的标准差，获得调控样本的数量性状值y_i,t的概率为：

$f_{i} (y_{i, t}) = \frac{1}{\sqrt{2 π} σ (t)} \exp (- \frac{{(y_{i, t} - y_{i} (t))}^{2}}{2 σ^{2} (t)})$

则得到数量性状理论值对应的参数组Θ在调控样本上的适应度为：

$p_{i} (Θ) = Π_{t = 1}^{T} f_{i} (y_{i, t})$

所述参数组Θ在所有样本上的适应度为：

$p (Θ) = Π_{t = 1}^{T} p_{i} (Θ)$

所述步骤依据所述适应度选择最优预测参数，包括：

选取适应度最大值的参数组作为最优预测参数，表示为：

$\tilde{Θ} = \max_{Θ} p (Θ)$

优选的，所述步骤利用所述最优预测参数、样本数据、样本生物量和环境信息数据生成所述调控样本的最优调整方案，包括：

所述调控样本基于所述最优预测参数的数量性状值表示为：

$y_{Θ, i}^{Ω} (t)$

其中，所述Ω为所述样本所在的空间布局；

利用下式得到所述最优调整方案。

$\min_{Ω} Σ_{i = 1}^{n} y_{Θ, i}^{Ω} (t)$

优选的，所述步骤根据所述最优调整方案，调整所述样本的生长环境，包括：

所述生长环境包括：样本与周围植物的空间位置关系、周围植物的生长状态、生长环境中的阳光、温度和水分中的至少一种。

优选的，所述方法还包括：

判断所述调控样本生长周期是否结束；

如果否，重复所述步骤利用所述最优预测参数、样本数据、样本生物量和环境信息数据生成所述调控样本的最优调整方案至所述步骤根据所述最优调整方案，调整所述调控样本的生长环境。

本发明还提供一种基于基因互作的植物生长预测调控系统，该系统包括：

数据获取模块，用于获取样本数据，所述样本数据包括数量性状数据、空间距离数据、关键位点数据、基因型数据和环境信息数据；

方程生成模块，用于利用所述样本数据，根据调控样本自身对生长的贡献、周围样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本生长预测方程；

参数预测模块，用于利用最优化方法求解所述样本生长预测方程，得到最优预测参数；

方案生成模块，用于利用所述最优预测参数、样本数据、样本生物量和环境信息数据生成所述调控样本的最优调整方案；

环境调整模块，用于根据所述最优调整方案，调整所述调控样本的生长环境。

优选的，所述方程生成模块包括：

第一参数获取单元，用于获取调控样本自身对生长的贡献参数；

第二参数获取单元，用于获取周围样本对调控样本生长的贡献参数；

第三参数获取单元，用于获取环境因素对样本生长的贡献参数；

方程生成单元，用于选取所述调控样本周围对样本生长产生直接影响的影响样本，利用所述样本数据，根据调控样本自身对生长的贡献、影响样本对调控样本生长的贡献及环境因素对样本生长的贡献建立样本生长预测方程，表示为：

其中，s_j为影响样本，j=n_i为影响样本的序号。

本发明的上述技术方案的有益效果如下：

上述方案中，通过获取包括数量性状数据、空间距离数据、关键位点数据、基因型数据和环境信息数据的样本数据，能够基于样本数据全面分析影响样本生长的因素，利用所述样本数据，根据调控样本自身对生长的贡献、周围样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本生长预测方程，充分考虑了基因互作对样本生长的影响，利用最优化方法求解所述样本生长预测方程，得到最优预测参数，生成最优调整方案，根据所述最优调整方案，调整所述调控样本的生长环境，充分考虑到植物基因对调控样本生长的影响，为样本生长的预测和调整提供了全面准确的最优调整方案，完善调控样本的生长优化。

附图说明

图1为本发明的实施例基于基因互作的植物生长预测调控方法的流程图；

图2a为本发明的实施例基于基因互作的植物生长预测调控系统的结构图；

图2b为本发明的实施例基于基因互作的植物生长预测调控系统的结构图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

本发明针对现有技术无法通过基因互作推断植物过去的生长状况，预测未来的生长趋势的问题，提供一种基于基因互作的植物生长预测调控方法。

如图1所示，本发明的实施例基于基因互作的植物生长预测调控方法的流程图，所述方法包括：

步骤101：获取样本数据，所述样本数据包括数量性状数据、空间距离数据、关键位点数据、基因型数据和环境信息数据。

其中，所述数量性状数据包括所述调控样品在T个观测时刻的数量性状值即生物量，表示为：

{y_i,t},i=1,2,...,n;t=1,2,...,T

其中，n为所有样本数量，i表示调控样本，t为观测时刻；

所述空间距离数据包括调控样本与周围样本间的距离，表示为：

{d_i,j},i=1,2,...,n;j=1,2,...,n

其中，j表示周围样本；

所述关键位点数据为所述调控样本的关键位点数据表示为：

{g_k},k=1,2,...,K;

其中，K为关键位点数量；

可以通过已有成型的技术获取这些位点。当最终的数量性状在数值上有较大差异时，可以采用QTL的技术发现这些位点；如果最终的数量性状相同或差异不大，则可以采用Wu(2006)等的发现关键位点。每个关键位点有3种可能的基因型，即QQ、Qq和qq这三种，而每一个个体在固定的位点上必居其一。

所述基因型数据包括关键位点的基因数据，表示为：

{q_i,k},i=1,2,...,n;k=1,2,...,K

其中，q_i,k可以取、但只能取3个值0、1、2中的一个，分别表示QQ、 Qq和qq这三种基因型。

所述环境信息数据表示为：

{v_i,w},i=1,2,...,n;w=1,2,...,W

其中，W为环境因素影响的量。

可以通过传感器来实现样本数据的实时获得，并由传感器将样本数据发送回数据分析处理装置。

本实施例中，通过获取包括数量性状数据、空间距离数据、关键位点数据、基因型数据和环境信息数据的样本数据，能够基于样本数据全面分析影响样本生长的因素，样本数据可以由本领域技术人员根据对调控样本的影响因素和需要进行设定，并不以本实施例为限定。

步骤102：利用所述样本数据，根据调控样本自身对生长的贡献、周围样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本生长预测方程。

其中，建立样本生长预测方程的过程可以在数据分析处理装置中进行。

利用所述样本数据，获取调控样本自身对生长的贡献参数，表示为：

{α_k,g},k=1,2,...,K;g=0,1,2

获取周围样本对调控样本生长的贡献参数，表示为：

{β_k,g,m,h},k=1,2,...,K;g=0,1,2;m=1,2,...,K;h=0,1,2

其中，m为所述周围样本的关键位点数量，h为所述周围样本的关键位点数据；

某个基因型所在个体因为另一个基因型的存在而造成对生长率的负贡献。这组参数共有(3K)²-3K个。这是因为，当两个基因型不同时，彼此的影响程度是不一样的；但当两个基因型相同时，彼此对生长率的影响是一致的。

当k和m相同，并且k和m相同时，

β_k,g,m,h=β_m,h,k,g.

除此之外，上述等式不成立。

获取环境因素对样本生长的贡献参数，表示为：

{γ_w},w=1,2,...,W

选取所述调控样本周围对样本生长产生直接影响的影响样本，对调控样本产生直接影响的范围可以由本领域技术人员根据实际情况和需要进行设定，利用所述样本数据，根据调控样本自身对生长的贡献、影响样本对调控样本生长的贡献及环境因素对样本生长的贡献建立样本生长预测方程，表示为：

其中，s_j为影响样本，j=n_i为影响样本的序号。

本实施例中，利用所述样本数据，根据调控样本自身对生长的贡献、周围样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本生长预测方程，充分考虑了基因互作对样本生长的影响，本领域技术人员还可以根据需要添加其他对调控样本生长影响的因素和参数，并不以本实施例为限定。

步骤103：利用最优化方法求解所述样本生长预测方程，得到最优预测参数。

其中，样本生长预测方程组由于方程数量多、数量关系复杂，以及方程数量n不确定等原因，几乎无法求得其解析解。因此，需要用数值解的方式对其求解，其方法包括：

设定初始边界条件；

设定参数；

利用所述初始边界条件和设定的参数通过所述样本生长预测方程得到数量性状理论值；

计算数量性状理论值对实际测量数据的适应度；

依据所述适应度选择最优预测参数。

步骤104：利用所述最优预测参数、样本数据、样本生物量和环境信息数据生成所述调控样本的最优调整方案。

步骤105：根据所述最优调整方案，调整所述调控样本的生长环境。

其中，所述生长环境包括：样本与周围植物的空间位置关系、周围植物的生长状态、生长环境中的阳光、温度和水分中的至少一种，本领域技术人员可以根据最优调整方案进行自由调整。

首先，可以自动收集并记录由传感器传回所采集的信息，包括当前每个样本个体的生物量、个体间的位置关系，以及环境因素等。然后，以当前时刻为起始时刻，以当前状况为边界条件，重新进行环境变量的优化，得到环境因素的理论输入值。

然后，把优化方案传回给控制器，通过控制器调节生长环境变量，时整个的生长过程依照最优调整方案进行。

本实施例中，通过获取包括数量性状数据、空间距离数据、关键位点数据、基因型数据和环境信息数据的样本数据，能够基于样本数据全面分析影响样本生长的因素，利用所述样本数据，根据调控样本自身对生长的贡献、周围样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本生长预测方程，充分考虑了基因互作对样本生长的影响，利用最优化方法求解所述样本生长预测方程，得到最优预测参数，生成最优调整方案，根据所述最优调整方案，调整所述调控样本的生长环境，充分考虑到植物基因对调控样本生长的影响，为样本生长的预测和调整提供了全面准确的最优调整方案，完善调控样本的生长优化。

在步骤103中，设定初始边界条件为每个样本在第1个观察时刻的数量性状数据既生物量。注意，这个量并不是测量得到的，而是在一定范围内设定的。

如果增加第0个观测时刻，让在第0时刻的每个植物个体的数量性状数据生物量均为0，那么就无需设定边界条件。

参数设定包括：对调控样本自身对生长的贡献参数、调控样本生长的贡献参数和环境因素对样本生长的贡献参数进行设定。在设定前，需要先给出每个参数的范围。这需要从样本中统计获得。例如，可以将样本自身对生长的贡献参数设定在0～0.5之间，将调控样本生长的贡献参数设定在0～0.1之间，环境因素对样本生长的贡献参数在对环境因素做归一化处理后，将其值设定在0～1 之间。

所述步骤利用所述初始边界条件和设定的参数通过所述样本生长预测方程得到数量性状理论值，包括：

设定步长Δ，步长越小，计算越精确，但计算量越大；步长越大，计算量越小，但结果越不精确，本领域技术人员可以自行设定，优选的取Δ=10-6；

获取样本在t₀时刻的数量性状理值y(t₀)；

则调控样本在(t₀+Δ)时刻的数量性状值表示为：

所述步骤计算数量性状理论值对实际测量数据的适应度，包括：

计算所有样本的数量性状值的标准差，表示为：

σ(t)=Ψ(y_1,t,y_2,t,...,y_n,t)

将样本生长预测方程得出的数量性状值作为方差，把已测数据看作随机变量Yi，那么它满足如下正态分布：

Y_i～N(y_i(t),σ(t))

基于正态分布，利用所述数量性状值的标准差，获得调控样本的数量性状值y_i,t的概率为：

$f_{i} (y_{i, t}) = \frac{1}{\sqrt{2 π} σ (t)} \exp (- \frac{{(y_{i, t} - y_{i} (t))}^{2}}{2 σ^{2} (t)})$

则得到数量性状理论值对应的参数组Θ在调控样本上的适应度为：

$p_{i} (Θ) = Π_{t = 1}^{T} f_{i} (y_{i, t})$

所述参数组Θ在所有样本上的适应度为：

$p (Θ) = Π_{t = 1}^{T} p_{i} (Θ)$

所述步骤依据所述适应度选择最优预测参数，包括：

选取适应度最大值的参数组作为最优预测参数，表示为：

$\tilde{Θ} = \max_{Θ} p (Θ)$

求解最优预测参数为一个高度非线性的优化问题，穷举求解又具有极高的复杂度，而梯度法求解又容易陷入局部最优，因此，可以采用全局优化的手段，进行优化求解。根据数据的特点，可以采用遗传算法，使得在可行的时间内得到最优或次优的参数组即为最优预测参数。

在步骤104中，所述调控样本基于所述最优预测参数的数量性状值表示为：

$y_{Θ, i}^{Ω} (t)$

其中，所述Ω为所述样本所在的空间布局；

利用下式得到所述最优调整方案。

$\min_{Ω} Σ_{i = 1}^{n} y_{Θ, i}^{Ω} (t)$

上式可以采用遗传算法等全局优化算法解决。但是，由于植物间的行距和株距一般是固定的，上述优化问题中的n可以控制在8个（目标个体周围有一层个体包围）就可以获得良好的效果。

优选的，所述基于基因互作的植物生长预测调控方法还包括：

步骤106：判断所述调控样本生长周期是否结束；

如果否，重复所述步骤104至步骤106。

如图2a所示，本发明的实施例基于基因互作的植物生长预测调控系统的结构图，所述系统包括：

数据获取模块201，用于获取样本数据，所述样本数据包括数量性状数据、空间距离数据、关键位点数据、基因型数据和环境信息数据。

方程生成模块202，用于利用所述样本数据，根据调控样本自身对生长的贡献、周围样本对调控样本生长的贡献及周围环境对调控样本生长的贡献建立样本生长预测方程。

参数预测模块203，用于利用最优化方法求解所述样本生长预测方程，得到最优预测参数。

方案生成模块204，用于利用所述最优预测参数、样本数据、样本生物量和环境信息数据生成所述调控样本的最优调整方案。

环境调整模块205，用于根据所述最优调整方案，调整所述调控样本的生长环境。

如图2b所示，所述方程生成模块202包括：

第一参数获取单元206，用于获取调控样本自身对生长的贡献参数。

第二参数获取单元207，用于获取周围样本对调控样本生长的贡献参数。

第三参数获取单元208，用于获取环境因素对样本生长的贡献参数。

方程生成单元209，用于选取所述调控样本周围对样本生长产生直接影响的影响样本，利用所述样本数据，根据调控样本自身对生长的贡献、影响样本对调控样本生长的贡献及环境因素对样本生长的贡献建立样本生长预测方程，表示为：

其中，s_j为影响样本，j=n_i为影响样本的序号。

需要说明的是：上述实施例提供的基于基因互作的植物生长预测调控系统在实现上述功能时，仅以上述功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的基于基因互作的植物生长预测调控系统与基于基因互作的植物生长预测调控方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于基因互作的植物生长预测调控方法及系统 [P] . 中国专利： CN103810403B . 2017.02.08
2. 一种基于模型预测控制的电氢耦合系统功率调控方法 [P] . 中国专利： CN111614089B . 2021.10.01
3. PREDICTION MODE SELECTION METHOD, AN APPARATUS THEREFOR TO REDUCE THE NUMBER OF PREDICTION MODE CANDIDATES ON THE BASIS OF THE DIRECTIVITY OF A PRINCIPAL EDGE, A MOVING PICTURE COMPRESSION METHOD USING THE METHOD, A MOVING PICTURE ENCODER INCLUDING THE APPARATUS, AND A COMPUTER RECORDING MEDIUM RECORDING A PROGRAM FOR EXECUTING THE METHOD [P] . 韩国专利： KR20040110755A . 2004-12-31

机译：预测模式选择方法，一种基于主边的方向性来减少预测模式候选的数量的装置，一种使用该方法的运动图像压缩方法，一种包括该装置的运动图像编码器以及一种编码器执行该方法的程序
4. A system for predicting tension of mooring lines through location information prediction and location information learning based on ocean information of the offshore platform [P] . 韩国专利： KR102163910B1 . 2020-10-12

机译：一种基于离岸平台海洋信息的位置信息预测和位置信息学习预测系泊缆张力的系统
5. POLYNUCLEOTIDE FOR DRUG METABOLISM PREDICTION INCLUDING SINGLE NUCLEOTIDE POLYMORPHISM OF NR1I2 GENE, A KIT AND A DRUG METABOLISM PREDICTION METHOD USING THEREOF [P] . 韩国专利： KR20120029953A . 2012-03-27

机译：用于预测药物代谢的多核苷酸，包括NR1I2基因的单核苷酸多态性，一种试剂盒和一种基于其的药物代谢预测方法