首页> 中国专利> 用于推断中国汉族人群个体年龄的组合标志物及其应用

用于推断中国汉族人群个体年龄的组合标志物及其应用

摘要

本申请公开了用于推断中国汉族人群个体年龄的组合标志物及其应用。所述组合标志物包括8个CpG位点:chr6:11044628、cg06639320、cg14361627、chr1:207823723、cg19283806、cg17740900、cg07553761和cg26947034。本申请公开的8个CpG位点均具有强年龄相关性,以此8个CpGs组合构建的年龄推断模型对于中国汉族人群个体年龄推断具有高准确率和灵敏度。在实际案件应用中,以该年龄推断模型构建的年龄推断方法能够准确推断未知样本年龄,年龄推断误差为0.27岁。

著录项

  • 公开/公告号CN114774557A

    专利类型发明专利

  • 公开/公告日2022-07-22

    原文格式PDF

  • 申请/专利权人 华中科技大学;

    申请/专利号CN202210204938.X

  • 发明设计人 黄代新;韩雪丽;肖超;易少华;

    申请日2022-03-02

  • 分类号C12Q1/6888;C12Q1/6844;C12N15/11;G06N5/04;G16B25/20;G06K9/62;G06F17/18;

  • 代理机构北京金智普华知识产权代理有限公司;

  • 代理人张晓博

  • 地址 430074 湖北省武汉市洪山区珞喻路1037号

  • 入库时间 2023-06-19 16:04:54

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-22

    公开

    发明专利申请公布

说明书

技术领域

本申请涉及法医学年龄推断技术领域,尤其涉及用于推断中国汉族人群个体年龄的组合标志物及其应用。

背景技术

随着分子生物学的飞速发展,一些与人类发育及衰老过程相关联的生物分子标记被发现,给我们带来了新的研究视角和方向。相关研究表明,在推断个体年龄方面,DNA甲基化明显优于其他生物分子标记,如mRNA、信号结合T细胞受体删除环、天冬氨酸的外消旋化和端粒长度等,具有稳定性好,准确度和灵敏度高等优点,是目前公认的最具有应用前景的生物分子标记。

人类基因组特定位点的DNA甲基化(CpG)水平与年龄具有显著相关性,被称为“表观遗传学时钟”。目前,己有多个研究基于不同甲基化分析平台开发了可用于血液、唾液、口腔拭子、精液或更广泛组织的年龄推断模型,证实了DNA甲基化是法医学个体年龄推断中最有前景的生物标记物。研究己证实CpG标记的甲基化具有群体差异。

并且,现有技术一般将开发法医学年龄推断模型的过程分为三个阶段:CpGs(与年龄相关的CpGs)的筛选、候选CpGs的验证以及模型的训练与验证。在CpGs筛选阶段,少部分学者直接利用大样本DNAm芯片数据构建年龄推断模型,比如经典的“HoRvath时钟”。然而,这些模型往往包含了较多的CpGs(HoRvath时钟:353个或 110个),并且DNAm数据基于芯片平台,因而需要使用对应的DNAm芯片来检测这些位点的甲基化状态。可是芯片技术不仅成本高,还涉及复杂的生物信息学分析,更重要的是,它需要较多的高质量DNA模板(450K:>500ng;850K:>250ng),因此目前并不能较好地应用于法医学案件。

2015年,Huang等“Huang Y,Yan J,Hou J,et al.Developing a DNA methylationassay FoR human agepRediction in blood and bloodstain[J].FoRensic Sci IntGenet.2015, 17:129-136.”挑选了6个候选基因座(ASPA,ITGA2B,NPTX2,TOM1L1,ZDHHC22和ZIC4)上的CpGs,并使用焦磷酸测序技术分析了从9-75岁汉族个体收集的89份血液样本中位于6个基因座内总共38个CpG位点的甲基化水平,并以此构建年龄推断模型,然而其得的推断年龄与实际年龄的平均绝对误差为7.870岁,精度偏低。

发明内容

有鉴于此,本申请的目的在于筛选得到与年龄强相关的CpGs,并以此建立年龄推断模型,以应用于法医学个体年龄推断。

第一方面,本申请实施例公开了用于推断中国汉族人群个体年龄的组合标志物,所述组合标志物包括8个CpG位点:chr6:11044628、cg06639320、cg14361627、chr1:207823723、cg19283806、cg17740900、cg07553761和cg26947034。

第二方面,本申请实施例公开了一种引物组合物,所述引物组合物包括如SEQ IDNO.1~16所示的核苷酸序列的第一引物组合和如SEQ ID NO.17~32所示的第二引物组合;所述第一引物组合用于在同一反应体系中对8个CpG位点进行复合扩增,所述8个CpG位点包括chr6:11044628、cg06639320、cg14361627、chr1:207823723、 cg19283806、cg17740900、cg07553761和cg26947034;所述第二引物组合用于对所述复合扩增的产物进行单碱基延伸反应。

第三方面,本申请实施例公开了一种试剂盒,所述试剂盒包含用于检测第一方面所述的组合标志物的试剂;任选地,所述试剂盒进一步包括所述引物组合物。

第四方面,本申请实施例公开第一方面所述的组合标志物或第二方面所述的引物组合物在推断中国汉族人群个体年龄中的应用。

第五方面,本申请实施例公开了一种推断中国汉族人群个体年龄的方法,包括:

获得中国汉族健康个体血液样本的8个CpG位点的甲基化率数据,并以此构成训练集;

根据所述训练集构建年龄推断模型,所述年龄推断模型为通过对所述训练集中8个CpG位点的甲基化率数据与所述中国汉族健康个体的实际年龄之间进行回归分析和训练得到的回归模型;

将待测中国汉族个体的8个CpG位点的甲基化率输入至所述年龄推断模型,以得到推断的该个体的推断年龄;

其中,所述8个CpG位点chr6:11044628、cg06639320、cg14361627、chr1:207823723、cg19283806、cg17740900、cg07553761和cg26947034。

在本申请实施例中,所述获得中国汉族健康个体血液样本的8个CpG位点的甲基化率数据的步骤包括:

获得转化的中国汉族人群个体的DNA样本;

对所述DNA样本进行8个CpG位点的复合PCR扩增,所述8个CpG位点为chr6:11044628、cg06639320、cg14361627、chr1:207823723、cg19283806、cg17740900、cg07553761和cg26947034;

将所述复合PCR扩增的产物作为模板进行单碱基延伸反应;

对所述单碱基延伸反应得到的单碱基延伸产物进行纯化和变性,得到变性产物;

对所述变性产物进行ABI测序,以确定所述变性产物对应的毛细管电泳图中各个峰的颜色和位置,依次确定对应的CpG位点;

根据毛细管电泳图中各个峰的颜色和位置,计算所述确定的CpG位点的甲基化率。

在本申请实施例中,所述复合PCR扩增的引物包括如SEQ ID NO.1~16的核苷酸序列,所述单碱基延伸反应的引物包括如SEQ ID NO.17~32的核苷酸序列。

在本申请实施例中,所述回归模型为多元线性回归(MLR)模型,所述MLR模型的回归方程为:个体年龄=22.333+39.068×chr6:11044628+13.626×cg06639320–12.096×chr1:207823723–12.417× cg19283806+145.103×cg14361627–0.131×cg17740900+25.946×cg07553761–34.205×cg2 6947034。

第六方面,本申请实施例还公开了用于推断中国汉族人群个体年龄的系统,包括:

数据获得装置,用于获得中国汉族健康个体血液样本的8个CpG位点的甲基化率数据,并以此构成训练集;

模型装置,所述模型装置与所述数据获得装置相连,所述模型装置用于根据所述训练集构建年龄推断模型;

年龄推断装置,与所述模型装置相连,用于将待测中国汉族个体的8个CpG位点的甲基化率数据输入至所述年龄推断模型并得到该个体的推断年龄。

在本申请实施例中,所述数据获得装置包括:

甲基化处理体系,用于对所述中国汉族人群个体的血液DNA进行转化处理,使得未发生甲基化的胞嘧啶转化为尿嘧啶,获得转化处理的DNA样本;

PCR扩增体系,用于对所述转化的DNA样本进行复合PCR和单碱基延伸反应以得到变性产物;

测序装置,所述测序装置与转化处理装置相连,所述测序装置所述变性产物进行ABI测序,以确定所述变性产物对应的毛细管电泳图中各个峰的颜色和位置,依次确定对应的CpG位点;

计算装置,与所述测序装置相连,用于根据毛细管电泳图中各个峰的颜色和位置,计算所述确定的CpG位点的甲基化率,并以此构建训练集,所述训练集包括用于训练的中国汉族人群训练组样本的DNA甲基化数据,所述中国汉族人群包括中国汉族成年男性和中国汉族成年女性,实际年龄分布在2~82岁。

与现有技术相比,本申请至少具有以下有益效果之一:

本申请公开的8个CpG位点均具有较高的年龄相关性(0.8

本申请提供的基于8个CpG位点甲基化率数据构建的年龄推断模型在进行年龄推断时,最低可检测1ng转化DNA。本申请提供的年龄推断方法在实际案件应用中年龄推断误差为0.27岁。由此说明,本申请实施例提供的年龄推断方法具有高准确率和灵敏度,具有良好的实际应用价值。

附图说明

图1为本申请实施例提供的8个CpG位点的毛细管电泳甲基化水平检测图。

图2为本申请实施例提供的检测血液样本中8个CpGs甲基化水平和年龄的相关性。

图3为本申请实施例提供的基于训练集构建的MLR模型,图中,X轴:样本实际年龄,Y轴:样本推断年龄,R:Pearson相关系数,MAE:平均绝对误差,RMSE:均方根误差。

图4为本申请实施例提供的构建的MLR对验证集的验证结果,图中,X轴:样本实际年龄,Y轴:样本推断年龄,R:Pearson相关系数,MAE:平均绝对误差,RMSE:均方根误差。

图5为本申请实施例提供的年龄推断方法对三个志愿者原本的年龄推断灵敏度试验结果。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合实施例对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请中未详细单独说明的试剂均为常规试剂,均可从商业途径获得;未详细特别说明的方法均为常规实验方法,可从现有技术中获知。

一、材料与方法

1、样本采集

选取529例中国汉族无关健康个体血液样本,其中女性240名(2.33~82岁),男性289名(2.17~79岁)。同时将529例血样按7:3比例随机分成训练组和验证组,其中训练组样本数为374个(男性203位,女性171位),验证组样本数为155个(男性86位,女性69位)。将样本采集日期距身份证、出生证明或户口簿上记载的出生日期的时间计算为实际年龄。本研究经华中科技大学同济医学院医学伦理委员会批准,所有志愿者都签署了书面知情同意书。

2、DNA提取与转化

使用DNeasy Blood&Tissue Kit(Qiagen,Hilden,Germany)提取200μL外周血基因组DNA,然后用50μL Buffer AE洗脱。取2μL基因组DNA,使用Nanodrop 2000 超微量分光光度计进行定量。随后,通过琼脂糖凝胶电泳对1μL基因组DNA进行质检。经质检,所有合格的血液样本基因组DNA进行亚硫酸氢盐转化。使用EpiTect Fast DNA Bisulfite Kit(Qiagen,Hilden,Germany)转化600ng基因组DNA,以使得未甲基化的胞嘧啶转化为尿嘧啶;然后用15μL Buffer EB洗脱,获得后续扩增所需DNA模板。

3、引物设计

本申请实施例提供了用于推断中国汉族人群个体年龄的组合标志物,所述组合标志物包括8个CpG位点:chr6:11044628、cg06639320、cg14361627、chr1:207823723、cg19283806、cg17740900、cg07553761和cg26947034。

通过对转化的DNA进行扩增,以获得DNA模板中如上所述的8个CpGs的甲基化数据,本申请实施例还公开了一种引物组合物,包括如SEQ ID NO.1~16所示的核苷酸序列的第一引物组合和如SEQ ID NO.17~32所示的第二引物组合;第一引物组合用于在同一反应体系中对8个CpG位点进行复合扩增;第二引物组合用于对所述复合扩增的产物进行单碱基延伸反应。所有引物均由生工生物工程(上海)股份有限公司使用ULTRAPAGE纯化方法合成。

第一引物组合的引物序列如表1所示。

表1 8个CpG位点的第一引物组合引以及片段大小

注:Y、R表示兼并碱基C/T、G/A。

第二引物组合的序列如表2所示,其5'端添加(GACT)n的方式,设计不同长度的单碱基延伸引物。所有引物均由生工生物工程(上海)股份有限公司采用HPLC纯化方式合成。

表2 8个CpGs的第二引物组合序列和大小

注:Y、R表示兼并碱基C/T、G/A。

4、构建复合PCR体系

8个CpG位点首先进行单位点PCR反应,用琼脂糖凝胶电泳检测各位点PCR引物特异性,观察是否会出现非特异性条带。再将所有CpG位点置于一个反应体系中进行复合扩增,使用聚丙烯酰胺凝胶电泳探索该体系最合适的循环条件和引物浓度,由此构建的结果如表3、4所示。

表3复合PCR反应体系

表4复合PCR反应程序

5、单碱基延伸反应

(1)复合PCR产物纯化

复合PCR反应产物中的多余的引物序列和dNTPs需要被去除。首先将rSAP (1U/μL)和Exonuclease I(5U/μL)按1:1的比例混合,随后在新200μL PCR管中依次加入2μL混合物和3μL的复合PCR产物,混匀离心,最后将PCR管放到热循环仪上,循环参数设置为37℃60min,80℃20min,以得到纯化后的扩增产物。

(2)单碱基延伸反应(SBE)

将步骤(1)纯化后的扩增产物作为模板,根据实验需求将所有测序位点如表2 所示的第二引物组合按一定的浓度混合,使用SNapshot TM Multiplex Kit进行单碱基延伸反应,其反应体系和反应程序如表5、6所示。

表5单碱基延伸反应体系

表6单碱基延伸反应程序

(3)单碱基延伸反应的产物纯化及变性

取出单碱基延伸反应的产物,简短离心以清除管盖上的水珠,随后在SBE产物中加入1μL rSAP,盖上PCR管盖,混匀离心,置于热循环仪上,循环参数设置为 37℃60min,80℃20min,完成产物纯化。将去离子甲酰胺(Hi-Di TM Formamide)和 GeneScanTM120 LIZ TMdye Size Standard按36:1比例充分混合,取9.0μL混合后的甲酰胺-120LIZ加入到离心管内,再加入1μL纯化后的SBE产物,涡旋混匀仪充分震荡混匀,简短离心后放到热循环仪上,变性条件设置为95℃,5min,变性完成后立即置于冰上。

6、遗传测序仪检测

将变性产物全部加到96孔加样板上,打开ABI测序仪,输入样本数据,电泳条件设置为15kv,30min。经ABI测序仪检测后,用

7、8个CpGs甲基化水平分析

经过预实验确定CpG位点复合PCR和SBE延伸反应的最适引物浓度、退火温度、循环次数以及模板量等扩增条件,最后用3130基因遗传分析仪对所有样本在最适条件下进行所选CpG位点甲基化水平检测并分析。根据毛细管电泳图中各个位点产物峰的颜色和峰高,计算该位点的甲基化水平。

SBE引物设计分为正反两个方向,正向引物的CpG位点产物峰表现为紧邻的红色和黑色峰,分别代表甲基化的胞嘧啶(C)和未甲基化的胸腺嘧啶(T),其甲基化水平计算公式为:甲基化率=C峰高/(C峰高+T峰高)×100%。反向引物的CpG位点产物峰表现为紧邻的蓝色和绿色,分别代表甲基化的鸟嘌呤(G)和未甲基化的腺嘌呤(A),其甲基化水平计算公式为:甲基化率=G峰高/(G峰高+A峰高)×100%。

当产物峰中只出现单一的T/A峰时,说明为完全未甲基化位点,甲基化水平为0;当产物峰中只出现单一的C/G峰时,说明为完全甲基化位点,甲基化水平为1。根据上述公式进行CpG位点的甲基化水平计算,并得到所有样本甲基化数据。

通过分析8个CpGs的年龄相关性,进一步建立适用于中国汉族人群血样的年龄推断模型。使用R软件包对所有样本进行统计学分析,并利用Graphpad Prism 8软件制作相关图表。

8、年龄推断模型的建立以及获得推断年龄的方法

基于上述步骤,本申请实施例公开了一种推断中国汉族人群个体年龄的方法,包括:

S1、获得中国汉族健康个体血液样本的8个CpG位点的甲基化率数据,并以此构成训练集;8个CpG位点chr6:11044628、cg06639320、cg14361627、chr1:207823723、cg19283806、cg17740900、cg07553761和cg26947034。

S2、根据所述训练集构建年龄推断模型,所述年龄推断模型为通过对所述训练集进行的8个CpG位点的甲基化率数据与所述中国汉族健康个体的真实年龄之间进行回归分析和训练得到的回归模型;

S3、将待测中国汉族个体的8个CpG位点的甲基化率输入至所述年龄推断模型,以得到该个体的推断年龄。

步骤S2中,一个具体的实施例提供的年龄推断模型的建立步骤包括:

S21、使用R.4.0.2软件中的corr()函数对8个CpG位点与训练组和验证组中个体样本的实际年龄进行皮尔逊(Pearson)相关性分析,得到8个CpG位点Pearson相关系数。其中,训练组个体样本的甲基化数据组成训练集,验证组个体样本的甲基化数据组成验证集。

S22、基于Pearson相关性分析结果,利用训练集数据,在R.4.0.2软件中使用lm()函数构建MLR年龄推断模型;

S23、利用DMwR软件包对构建的MLR年龄推断模型进行相关系数(r)、平均绝对误差(MAE)和均方根误差(RMSE)等参数计算,将这些参数作为衡量根据MLR年龄推断模型获得的推断年龄与真实年龄之间误差大小的指标。

一个具体的实施例中,步骤S3还包括:将验证集的数据分别输入至构建的MLR 年龄推断模型,以相关系数(r)、平均绝对误差(MAE)和均方根误差(RMSE)等为衡量标准,评估基于训练集数据构建的MLR年龄推断模型的年龄推断效能。

具体的验证过程为:

S31、使用R.4.0.2predict()函数验证集数据导入MLR模型中,DMwR包regr.eval() 函数获得验证集的r、MAE和RMSE,最后data.frame()函数获得验证组中个体样本的推断年龄数据,导出后在Office 2019中将验证组样本分为六个年龄组:2~19岁; 20~29岁;30~39岁;40~49岁;50~59岁;60~82岁以推断年龄与实际年龄相差在±5 岁范围内为推断正确的前提下,计算各年龄组推断年龄在实际年龄±5岁范围内的样本百分比即推断准确率。

S32、同时使用SUMPRODUCT算法得到各年龄组MAE值,从而对模型进行全面评估。

S33、最后在R4.0.2中对所有样本进行t-test和Wilcoxon-Matt-Whitney test秩和检验,以检测所确定的CpGs是否有性别差异。所有数据分析过程在R 4.0.2中进行,部分统计在Office 2019中完成,绘图在Graphpad Prism 8中完成。

9、灵敏度检验

在保证不降低上述获得推断年龄的方法准确性的条件下,通过不断减少复合PCR反应中转化后DNA用量进行所选CpG位点甲基化水平检测,以此评估该方法推断个体年龄的灵敏度。

随机挑选三名年龄分别为21岁、40岁和60岁的志愿者,复合PCR反应使用的转化后基因组DNA量分别为20ng、10ng、5ng、2ng、1ng,同时每组进行4次平行重复实验,利用获得的所有甲基化数据计算每组推断年龄的标准差(SD)、平均数(Mean) 和平均绝对误差(MAE)。以20ng DNA输入量获得的推断年龄与实际年龄之间的参数为基准,假设推断结果正确意味着推断年龄与实际年龄误差范围在±2岁之间,同时以4次重复实验推断年龄的SD+MAE≤5岁作为补充条件来评估上述年龄推断模型的灵敏度。

10、实际应用

取某奸杀案中遗留在现场的血迹检材2021-503BN-A的DNA溶液100ng,采用EpiTect Fast DNA BisulFite ConveRsion Kit(德国凯杰生物技术有限公司)进行DNA 亚硫酸盐转化,采用个体年龄推断甲基化扩增试剂盒(本实验室研制)对转化DNA 进行复合PCR扩增,采用SNaPshot

二、结果

1、建立复合PCR体系与复合SBE体系

为了将所选AR-CpGs全部置于一个反应体系中,经过多次电泳反复调试,最终确定了8个CpG位点的复合PCR扩增第一引物组合和单碱基延伸反应的第二引物组合的终浓度(表7)。

表7 8个CpG位点在复合PCR和SBE体系中的引物终浓度

在复合体系引物终浓度优化完成后,对所有样本进行复合PCR和单碱基延伸反应,以检测样本中8个CpGs的甲基化率。其中完全未甲基化管家基因β-actin的CpG 位点(ACTB)作为内部对照,用于检验样本亚硫酸氢盐是否转化完全,如图1,当在电泳图中ACTB仅能观察到A峰时,说明转化完全。

2、分析8个CpGs甲基化水平与年龄的相关性

基于建立的复合PCR体系和单碱基延伸反应体系,本次研究共检测了529个中国汉族人群血液样本,并获得了个8个CpG位点的甲基化数据。为了评估8个CpG 位点甲基化水平和年龄之间的相关性,529份甲基化数据与对应血液样本实际年龄进行皮尔逊相关性分析,检验结果得出所有CpG位点都具有很强的年龄相关性,Pearson 相关系数范围为0.8363≤r≤0.9251。

根据各位点的Pearson相关系数绘制的甲基化水平-年龄相关散点图见图2。从图中可以看出,chr6:11044628(ELOVL2)与年龄的相关性最高,相关系数r=0.9251,同时cg06639320和cg26947034年龄相关性也分别高达0.9054和0.8932,即使cg14361627的甲基化水平与年龄的关联程度最低,但也达到了0.8363,属于与年龄之间具有强相关范畴。综合皮尔逊相关系数,可以初步将这8个CpG位点认为是血液中具有推测中国汉族人群年龄效能的生物分子标记,即根据它们的甲基化水平变化趋势可以推断具体年龄。同时,529份总样本被分为男性组(289名)和女性组(240 名),采用两个独立样本t检验和Wilcoxon-Matt-Whitney test秩和检验对CpGs进行性别差异检验,结果显示这8个CpGs和年龄的相关性没有显著的性别差异(p>0.05)。

3、构建年龄推断模型

由上述方法构建得到的MLR模型的回归方程为:

个体年龄=22.333+39.068×chr6:11044628+13.626×cg06639320–12.096×chr1:207823723–12.417×cg19283806+145.103×cg14361627–0.131×cg17740900 +25.946×cg07553761–34.205×cg26947034,这个模型解释了92.33%的年龄变异(R

4、对年龄推断模型的验证

使用验证集155份甲基化数据(男性86,女性69)对训练集构建的年龄推断模型进行验证,选用相同的统计学指标r、MAE和RMSE来检验模型推断年龄的准确性。

结果如图4所示,在MLR模型中,推断年龄和实际年龄的相关系数为0.9558, MAE和RMSE分别为3.7058岁和5.5937岁。

5、年龄推断模型在不同年龄段的推断效能

为了进一步分析年龄推断模型在不同年龄段的推断效能,将验证集样本分为六个年龄组:2~19岁;20~29岁;30~39岁;40~49岁;50~59岁;60~82岁。计算基于训练集数据构建的MLR年龄推断模型对各年龄组推断年龄和实际年龄的平均绝对误差MAE及推断准确率。以推断年龄与实际年龄相差在±5岁范围内为基准,将每个获得的结果解释为正确(未超过±5岁)或不正确(超过±5岁),获得各年龄组推断年龄在实际年龄±5岁范围内的样本百分比即为推断准确率,相关统计分析结果见表8。所有数据分析过程在R 4.0.2中进行,部分统计在Office 2019中完成,绘图在 Graphpad Prism 8中完成。

表8 MLR推断模型的年龄推断效能

注:AD表示推断年龄与实际年龄之间偏差的绝对值

由表8可知,在构建的MLR年龄推断模型的推断结果中,MAE值最小的年龄组模型的±5岁的推断准确率也最高,在60~82年龄组MAE值最大,推断准确率最低。

6、灵敏度

统计结果如图5和表9所示的,采用本申请实施例提供的年龄推断方法可以检测到DNA含量为1ng时甲基化水平,随着PCR扩增DNA输入量的减少,模型推断年龄的MAE变化幅度较大。

由表9可知,利用MLR年龄推断模型以及以此建立的年龄推断方法检测三个样本,结果显示当DNA含量为10ng时,推断年龄MAE最小,SD+MAE≤5岁,推断年龄与实际年龄误差范围在±2岁之间等三个条件同时满足。灵敏度测试结果表明当使用≥10ng的亚硫酸氢盐转化DNA时可以获得具有可靠准确度和一致性的年龄推断。由此说明,采用本申请实施例提供的MLR年龄推断模型以及以此建立的年龄推断方法能够对更低含量的DNA样本进行检测,且具有更高的灵敏度。

表9 MLR年龄推断模型的推断灵敏度

7、实际应用

按照本申请公开的MLR模型以及年龄推断方法计算,检材2021-503BN-A个体的生物年龄推断平均值在MLR模型中为38.27岁,与真实年龄38岁的误差为0.27 岁,小于0.3岁,更进一步验证了MLR模型推断年龄的精确性,为未来将模型标准化投入实际应用提供了较大可能性。

综上所示,本申请公开的8个CpG位点均具有较高的年龄相关性(0.8

以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。

序列表

<110> 华中科技大学

<120> 用于推断中国汉族人群个体年龄的组合标志物及其应用

<160> 27

<170> SIPOSequenceListing 1.0

<210> 1

<211> 19

<212> DNA

<213> Artificial Sequence

<400> 1

ggggygtagg gtaagtgag 19

<210> 2

<211> 26

<212> DNA

<213> Artificial Sequence

<400> 2

caacraataa atattcctaa aactcc 26

<210> 3

<211> 21

<212> DNA

<213> Artificial Sequence

<400> 3

gggttttggg agtatagtag t 21

<210> 4

<211> 18

<212> DNA

<213> Artificial Sequence

<400> 4

aaaataaccc cctcctcc 18

<210> 5

<211> 19

<212> DNA

<213> Artificial Sequence

<400> 5

tgggagtaag aggttgtgg 19

<210> 6

<211> 22

<212> DNA

<213> Artificial Sequence

<400> 6

cccctaatcc caacaaatac at 22

<210> 7

<211> 19

<212> DNA

<213> Artificial Sequence

<400> 7

tgagggaggg gaatgtttg 19

<210> 8

<211> 25

<212> DNA

<213> Artificial Sequence

<400> 8

acccttctct aaaaataact atcct 25

<210> 9

<211> 29

<212> DNA

<213> Artificial Sequence

<400> 9

ggtttttygg ttaagttatg tttaatagt 29

<210> 10

<211> 30

<212> DNA

<213> Artificial Sequence

<400> 10

aaaatttcrc tctattacca ttacctaact 30

<210> 11

<211> 29

<212> DNA

<213> Artificial Sequence

<400> 11

gttaaatttt tttagttttg ggatggtat 29

<210> 12

<211> 28

<212> DNA

<213> Artificial Sequence

<400> 12

cttcttacca aatcttcaat tctataca 28

<210> 13

<211> 21

<212> DNA

<213> Artificial Sequence

<400> 13

tatyggtggt ttgggggaga g 21

<210> 14

<211> 27

<212> DNA

<213> Artificial Sequence

<400> 14

aaaaaacact acrctccaca acataac 27

<210> 15

<211> 21

<212> DNA

<213> Artificial Sequence

<400> 15

gtgatgagtt agtggtttgg t 21

<210> 16

<211> 30

<212> DNA

<213> Artificial Sequence

<400> 16

acatatacaa acctcaaaat taaaataacc 30

<210> 17

<211> 18

<212> DNA

<213> Artificial Sequence

<400> 17

tgtggayttg ggagagga 18

<210> 18

<211> 20

<212> DNA

<213> Artificial Sequence

<400> 18

catcccccaa arttcacaat 20

<210> 19

<211> 19

<212> DNA

<213> Artificial Sequence

<400> 19

ggygatttgt aggtttagt 19

<210> 20

<211> 27

<212> DNA

<213> Artificial Sequence

<400> 20

gactggtttt gggagtatag tagttat 27

<210> 21

<211> 35

<212> DNA

<213> Artificial Sequence

<400> 21

gacgactgac tgatgggatt aaattttgga atatt 35

<210> 22

<211> 42

<212> DNA

<213> Artificial Sequence

<400> 22

gagactgact gactgactgg aggggaatgt ttgtatttat tt 42

<210> 23

<211> 48

<212> DNA

<213> Artificial Sequence

<400> 23

gactgactga ctgactgact ttaatagttt tagaaattat tttgtttt 48

<210> 24

<211> 58

<212> DNA

<213> Artificial Sequence

<400> 24

gactgactga ctgactgact gactgactga ctgactacaa attccttcct aatatccc 58

<210> 25

<211> 64

<212> DNA

<213> Artificial Sequence

<400> 25

gactgactga ctgactgact gactgactga ctgactgact cctcaaaaac crtcraccac 60

crac 64

<210> 26

<211> 70

<212> DNA

<213> Artificial Sequence

<400> 26

gactgactga ctgactgact gactgactga ctgactgact gactgactat tctttaacct 60

cccttataac 70

<210> 27

<211> 75

<212> DNA

<213> Artificial Sequence

<400> 27

gactgactga ctgactgact gactgactga ctgactgact gactgactga ctgactccac 60

cccacttctc tctaa 75

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号