首页> 中国专利> 基于易感SNP筛查复杂疾病易感SNP组合的方法

基于易感SNP筛查复杂疾病易感SNP组合的方法

摘要

本发明公开一种基于易感SNP筛查复杂疾病易感SNP组合的方法。本发明的方法可以迅速从大量数据中找到特定疾病的易感SNP组合。本发明采用易感SNP组合的方法旨在提供一种新的疾病风险评价的方法。易感SNP组合对于疾病风险的评估可能更优于单一易感SNP位点的风险评估效果,类似于低频突变导致遗传疾病效果。从具体实例结果看易感SNP组合的方法在复杂疾病风险预测中的效果可能会达到1,这是单个易感SNP不可能达到的效果。该方法可以应用于任何复杂疾病易感SNP组合的筛查和疾病遗传风险的预测。

著录项

  • 公开/公告号CN105354444A

    专利类型发明专利

  • 公开/公告日2016-02-24

    原文格式PDF

  • 申请/专利权人 华南理工大学;

    申请/专利号CN201510828517.4

  • 发明设计人 杜红丽;关宇佳;

    申请日2015-11-24

  • 分类号G06F19/22;

  • 代理机构广州市华学知识产权代理有限公司;

  • 代理人罗观祥

  • 地址 510640 广东省广州市天河区五山路381号

  • 入库时间 2023-12-18 14:21:19

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-01

    未缴年费专利权终止 IPC(主分类):G06F19/22 专利号:ZL2015108285174 申请日:20151124 授权公告日:20180619

    专利权的终止

  • 2018-06-19

    授权

    授权

  • 2016-03-23

    实质审查的生效 IPC(主分类):G06F19/22 申请日:20151124

    实质审查的生效

  • 2016-02-24

    公开

    公开

说明书

技术领域

本发明涉及利用公共数据库中SNP分型数据筛查疾病易感SNP组合的方 法,特别涉及一种基于易感SNP筛查复杂疾病易感SNP组合的方法。

背景技术

复杂疾病,如2型糖尿病、肥胖、心脑血管病等,因其发病机制复杂,往 往不是一个或几个基因的影响造成。近十年,国际包括国内采用全基因组关联 分析方法(GWAS)对大量个体的全基因组范围内的SNP分型数据进行统计分 析,筛出了大量易感SNP位点,譬如DIAGRAM委员会整合以前所有2型糖尿 病GWAS的数据,鉴定出69个易感SNP(NatureGenetics,2014)。既然复杂疾 病是有多个基因共同影响造成,在评估SNP风险时不应该单独评估单个SNP的 影响。

发明内容

为了克服现有技术的缺点与不足,本发明的目的在于提供一种基于易感 SNP筛查复杂疾病易感SNP组合的方法。本发明采用了一种新的方法评估多个 SNP的组合风险。该方法可以应用于任何复杂疾病易感SNP组合的筛查。

本发明的另一目的在于提供上述方法的应用。

本发明的目的通过下述技术方案实现:

一种基于易感SNP筛查复杂疾病易感SNP组合的方法,包括如下步骤:

本发明首先从已知的文献中找出与特定疾病相关的易感SNP,下载大量个 体全基因组的SNP分型数据,把每个个体易感SNP位点的基因型数据分离出来, 然后将这些易感SNP位点按一个顺序排列,如果某个易感SNP位点含有一个以 上易感等位基因(即含有1或2个易感基因型),用特定的英文字母来标记,这 样每一个个体就会得到一个等于或少于易感SNP位点数的字母字符串。然后分 别统计患病组和对照组中各种字符串的个数,并在患病组中找出对照组所没有 的字符串,再从中选出个数明显较多的字符串,再反过来按顺序将字母转换为 基因型,最终得到易感SNP组合。

所述的对照组是指健康群体。

所述的患病组是指疾病群体。

本发明的方法可以迅速从大量数据中找到特定疾病的易感SNP组合。

所述的基于易感SNP筛查复杂疾病易感SNP组合的方法在筛查复杂疾病易 感SNP组合中的应用。

所述的基于易感SNP筛查复杂疾病易感SNP组合的方法在复杂疾病风险预 测中的应用。

本发明相对于现有技术,具有如下的优点及效果:

为了克服复杂疾病单位点易感SNP评价疾病风险的不足,本发明采用易感 SNP组合的方法旨在提供一种新的疾病风险评价的方法。易感SNP组合对于疾 病风险的评估可能更优于单一易感SNP位点的风险评估效果,类似于低频突变 导致遗传疾病效果。从具体实例结果看易感SNP组合的方法在复杂疾病风险预 测中的效果可能会达到1,这是单个易感SNP不可能达到的效果。该方法可以 应用于任何复杂疾病易感SNP组合的筛查和疾病遗传风险的预测。

附图说明

图1是个体基因型原始数据示意图。

图2是14个随机个体的个体字符串的示意图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式 不限于此。

实施例1

1、SNP的选定

选择Genome-widetrans-ancestrymeta-analysisprovidesinsightintothe geneticarchitectureoftype2diabetessusceptibility中的69个2型糖尿病易感SNP (NatureGenetics,2014),见表1。

表169个2型糖尿病易感SNP

2、数据来源

所有全基因组SNP分型数据均是从http://www.ebi.ac.uk/ega/下载。

对照组WTCCC1projectsamplesfrom1958BritishBirthCohort(1991个样)。

2型糖尿病组WTCCC1projectType2Diabetes(T2D)samples(1504个样)。 个体基因型原始数据示意图见图1。

3、筛选SNP位点

根据表1中易感SNP位点的rs编号,将下载数据中每个个体的所有易感SNP 位点的基因型提取出来,一共提取了18个2型糖尿病易感SNP位点的基因型, 这18个易感SNP见表2。

表218个2型糖尿病易感SNP位点的基因型

Locus Lead SNP Locus Lead SNP NOTCH2 rs10923931 WFS1 rs4458523 RBMS1 rs7593730 KLF14 rs13233731 THADA rs10203174 CDKN2A/ rs10811661 IRS1 rs2943640 VPS26A rs1802295 GCKR rs780094 KCNJ11 rs5215 IGF2BP2 rs4402960 KLHDC5 rs10842994 PPARG rs1801282 CCND2 rs11063069 ADAMTS9 rs6795735 SPRY2 rs1359790 PSMD6 rs831571 RASGRP1 rs7403531

4、易感SNP位点的基因型标记

对于每个个体的这18个易感SNP位点的基因型,只要出现1个或2个易感 基因就标记如下,详见表3,无易感基因标记为缺省。

表3易感SNP基因型标记

SNP 基因型 转换后字符 rs10203174 CC、CT a rs10811661 CT、TT b rs10842994 CC、CT c rs10923931 GT、TT d rs11063069 AG、GG e rs13233731 AG、GG f rs1359790 AG、GG g rs1801282 CC、CG h rs1802295 CT、TT i rs2943640 AC、CC j rs4402960 GT、TT k rs4458523 GG、GT l rs5215 CC、CT m rs6795735 CC、CT n rs7403531 CT、TT o rs7593730 CC、CT p rs780094 CC、CT q rs831571 CC、CT r

5、得到字符串

按照表3中SNP顺序排列,对3945个个体(对照组1991个,2型糖尿病 组1504个)中每一个个体的18个位点基因型转换成字符串,得到一系列的字 符串,共3945个,从中随机选取14个个体,如图2所示。

6、统计筛查易感SNP组合

对3945个个体(对照组1991个,2型糖尿病组1504个)进行通过统计分 析发现在2型糖尿病组有但在对照组中没有的字符串即SNP组合,例如abcghp (即rs10203174、rs10811661、rs10842994、rs1359790、rs1801282、rs75937306 的SNP位点同时携带易感基因),出现的次数最多,却没在对照组中发现,结 果提示某个个体遗传检测只要出现以上组合,患2型糖尿病的风险可能为1。字 符串个数在5个以上的统计结果见表4。

表4字符串个数在5个以上的统计表

2型糖尿病 字符串个数 对照组 字符串个数 abcghp 10 abcghpr 7 abcghjpr 8 abcghjlnpr 6 abchjpr 7 abchnpr 6 abchlnp 7 abchpr 6 abcfghpr 6 abghpr 6 abcghjlpq 6 abhnpr 6 abcghjp 6 abcghjnpr 5 abcghlp 6 abcghlpqr 5

以本发明的数据显示易感SNP组合(频率很低)对于疾病风险的评估或许 更优于单一易感SNP位点的风险评估效果,类似于低频突变导致遗传疾病效果, 由于目前积累的大数据有限,如果积累到十万以上个体的数据时,用SNP组合 直接预测疾病的风险为100%或许成为可能。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施 例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替 代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号