首页> 中国专利> 基因变异分析装置、基因变异分析系统以及基因变异分析方法

基因变异分析装置、基因变异分析系统以及基因变异分析方法

摘要

作为本发明的一个方式,进行以下的分析,使对每个碱基种类进行了标记的分析对象的核酸样本进行电泳,检测每个碱基种类的标记信号,生成检测强度的波形数据,对每个碱基种类的上述波形数据的各峰值位置选择其他的峰值位置,计算各峰值位置的信号强度相对于选择出的其他峰值位置的信号强度的相对信号强度,在各峰值位置对分析对象的核酸样本的相对信号强度和已知的核酸样本的相对信号强度进行比较,进行与核酸样本的碱基排列坐标位置的各碱基种类的存在相关的分析。由此,实现高灵敏度、高精度地取得与作为目标的基因区域中存在的微量的基因变异相关的信息。

著录项

  • 公开/公告号CN104603609A

    专利类型发明专利

  • 公开/公告日2015-05-06

    原文格式PDF

  • 申请/专利权人 株式会社日立制作所;

    申请/专利号CN201380005624.6

  • 发明设计人 吉田真希子;横井崇秀;穴泽隆;

    申请日2013-07-31

  • 分类号G01N27/447(20060101);C12N15/09(20060101);C12Q1/68(20060101);

  • 代理机构11243 北京银龙知识产权代理有限公司;

  • 代理人曾贤伟;文志

  • 地址 日本东京都

  • 入库时间 2023-12-18 08:40:01

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-08-24

    授权

    授权

  • 2015-05-27

    实质审查的生效 IPC(主分类):G01N27/447 申请日:20130731

    实质审查的生效

  • 2015-05-06

    公开

    公开

说明书

技术领域

本发明涉及一种基因变异的分析方法以及基因变异的分析装置、分析系 统、分析方法。特别涉及以下的分析装置、分析系统、分析方法,其对从目标 基因的核酸样本得到的荧光强度波形数据进行分析来进行与核酸样本的碱基 排列坐标位置的各碱基种类的存在有关的分析。

背景技术

作为解读DNA碱基排列的方法,广泛使用应用了桑格法的组合了核酸的 片段化技术、核酸片段的荧光标记技术、高分辨率的电泳技术、以及高灵敏度 的荧光检测技术的DNA序列法。

上述DNA序列法首先准备希望解读碱基排列的DNA(模板DNA),使用 具有与模板DNA的一部分排列互补的排列的引物来进行模板DNA的复制反 应。这时,当在反应溶液中将双脱氧核苷酸作为锁定核苷酸按照预定的比例与 脱氧核苷酸一起混合时,合成反应在双脱氧核苷酸的取入位置停止,因此生成 各种碱基长度的核酸片段。在此,如果使用对于每种碱基不同的颜色的荧光色 素对引物或双脱氧核苷酸进行标记,则各核酸片段被与其末端碱基对应的色素 标记。通过使用毛细管电泳装置等使如此制成的核酸片段泳动,来分离为每个 碱基长度。在泳动的终端向核酸片段照射激光,通过检测器测定从各片段的末 端碱基产生的荧光。在电泳中越短的核酸片段移动越快,因此作为随时间的荧 光测定数据,得到与碱基排列对应的荧光强度波形数据。

使用了上述DNA序列法的DNA序列器是通过对荧光强度波形数据的各 峰值位置的4种荧光信号的强度进行比较来决定碱基排列的装置。

已知在人等的染色体组的碱基排列中,存在被称为单碱基多态性的基因变 异。将具有从上代向下代遗传的性质的先天的基因变异称为生殖细胞系列变 异。包含人在内的许多生物的染色体组由二倍体构成,因此关于生殖细胞系列 变异,在个体内或细胞内,分别以50%的比例存在2种碱基。在通过上述DNA 序列器分析存在这样的单碱基多态性的区域的情况下,在荧光强度波形数据的 对应于单碱基多态性的位置,同时检测出相当于2种碱基的荧光信号峰值。

但是,在上述序列法中,偶尔得到难以判定上述多态性、难以决定碱基排 列的荧光强度波形数据。作为其原因,可以考虑核酸样本的量少信号强度弱的 情况、由于核酸片段的高次构造等产生多余的信号成分的情况、由于化学处理 时、电泳时的条件信号产生失真的情况等。

在实际决定核酸样本的碱基排列时,如调查某特定基因的基因变异的情况 那样,该核酸样本的碱基排列的至少一部分已知的情况并不少。在存在这样的 已知的碱基排列的情况下,能够通过某种方法参照从已知的碱基排列得到的荧 光强度波形数据的信息来对新取得的荧光强度波形数据进行解释。在存在这样 的已知的碱基排列的情况下,如专利文献1、专利文献2公开的那样,能够通 过某种方法参照从已知的碱基排列得到的荧光强度波形数据的信息来对新取 得的荧光强度波形数据进行解释。

现有技术文献

专利文献

专利文献1:日本特开2002-055080号公报

专利文献2:日本特开2005-031051号公报

发明内容

发明要解决的问题

由于近年来的染色体组分析技术的发展,搞清楚了人的各种疾病和基因变 异的关联性,灵活运用基因信息来开发医药品。例如,关于癌,基因变异是其 发病的主要原因,对于部分治疗药品的选择、处方量的决定,应用患者个人的 基因检查已经成为保险项目。

相对于前面记载的生殖细胞系列变异,将由于癌等疾病造成的后天的基因 变异称为体细胞系列变异。体细胞系列变异的特征是无法预测染色体组上的变 异发生位置,另外无法预测个体内或组织内的变异存在比例。例如,在从癌症 患者切除的癌组织试样中包含癌细胞和正常细胞,并且在癌细胞之间,基因变 异也存在多样性,因此在某特定基因的某特定位置具有基因变异的细胞在试样 中的存在比例有时非常低。因此,与生殖细胞系列变异相比,为了检测体细胞 系列变异,需要更高灵敏度的检测方法。

在治疗方法、治疗药物的选择中,不只是目标基因在某特定位置的基因变 异的有无,有时还将其存在比例作为指标。因此,除了基因变异的高灵敏度的 检测以外,其存在比例的量化也是重要的。利用了桑格法的现有的DNA序列 器以决定碱基排列为目的,因此存在以下的大问题,微量存在的体细胞系列基 因变异的检测力不足,另外无法对其存在比例进行定量。

并且,作为不伴随基因排列的变异的基因表型变异之一,具有DNA甲基 化修饰,已知由于细胞的发生分化、细胞癌化DNA甲基化修饰状态变化。因 此,期待一种简便地检测甲基化修饰后的碱基排列的位置及其修饰比例的方 法。

在前面记载的专利文献1中提示了在进行多态性的判定和决定碱基排列 时,将在峰值位置具有最大的信号强度的碱基种类的信号强度作为标准化基 准,来对荧光强度波形数据的各峰值位置的信号强度进行标准化处理的方法。 在该标准化方法中,在该位置存在变异,并且其存在比例不恒定的情况下,无 法保证各碱基种类的信号强度的定量性。

另外,在前面记载的专利文献2中,提示了将荧光强度波形数据中的全部 峰值的平均强度作为标准化基准来对荧光强度波形数据的信号强度进行标准 化处理的方法。但是,荧光强度波形数据中的峰值强度在波形数据整体中进行 变动,另外其变动的情况在数据之间不同。因此,在将全部峰值的平均强度作 为基准的标准化方法中,个别的峰值的信号强度的标准化精度不足。在专利文 献2中,以决定主要的碱基排列为目的,因此标准化精度不是大的问题,但在 以基因变异的检测、其存在比例的定量为目的的情况下,不足的标准化精度成 为检测灵敏度降低、定量精度恶化的原因。

本发明鉴于这样的现有技术的问题点,其目的在于,针对微量存在的体细 胞系列基因变异,也能高灵敏度、高精度地得到与基因变异有关的信息。

解决问题的方案

作为本发明用于解决上述课题中的至少一个课题的一个方式,使对每个碱 基种类进行了标记的分析对象的核酸样本进行电泳,检测每个碱基种类的标记 信号来生成检测强度的波形数据,对每个碱基种类的上述波形数据的各峰值位 置选择其他的峰值位置,计算各峰值位置的信号强度相对于选择出的其他峰值 位置的信号强度的相对信号强度,在各峰值位置将分析对象的核酸样本的相对 信号强度和已知的核酸样本的相对信号强度进行比较,进行与核酸样本的碱基 排列坐标位置的各碱基种类的存在相关的分析。

发明效果

根据本发明,实现高灵敏度、高精度地取得与目标的基因区域中存在的微 量的基因变异有关的信息。

附图说明

图1是表示应用本发明的基因变异分析系统的结构例子的图。

图2是表示基因变异分析装置的测量部的例子的图。

图3是表示在决定碱基排列时对荧光强度波形数据进行的处理的图。

图4是表示荧光强度波形数据的例子的图。

图5是表示取得用于检测基因变异的相对信号强度信息的处理的一个例 子的图。

图6是表示在已知信息数据库中保存的用于检测基因变异的相对信号强 度信息的一个例子的图。

图7是表示本发明的基因变异的检测处理的一个例子的图。

图8是表示取得用于推定基因变异存在比例的相对信号强度信息的处理 的一个例子的图。

图9是表示应用本发明的基因变异分析装置的结构例子的图。

图10是表示本发明的基因变异存在比例的推定处理的一个例子的图。

图11是表示在已知信息数据库中保存的用于推定基因变异存在比例的相 对信号强度信息的一个例子的图。

图12是表示本发明的基因变异存在比例信息的显示例子的图。

具体实施方式

以下,参照附图说明本发明的实施方式。但是,本实施方式只不过是用于 实现本发明的一个例子,并非限定本发明。

在图1中,表示本实施方式的基因变异分析系统的结构例子。该系统具备 荧光强度波形数据测量部1a、1f、控制部1b、1g、荧光强度波形数据分析部 1c、已知信息数据库1d。

在图2中,表示荧光强度波形数据测量部1a、1f的结构例子。荧光强度 波形数据测量部1a、1f具备使通过荧光色素标记的核酸样本(2a)中的核酸 片段进行电泳的流路(2b)、随着时间检测荧光强度的检测器(2c)。

荧光强度波形数据测量部1a、1f通过进行了荧光标记的核酸片段在流路 (2b)中的电泳,使用检测器(2c)取得荧光强度波形数据。这时,既可以对 每个荧光色素分别进行电泳,由此单独取得各碱基种类的荧光强度波形数据, 也可以混合4种荧光色素进行电泳,由此同时取得4个碱基种类的荧光强度波 形数据。

在荧光强度波形数据分析部1c中,对荧光强度波形数据进行信号处理来 进行碱基排列的决定、变异的检测和定量。在荧光强度波形数据分析部1c内, 能够通过处理器解析并执行用于实现各个功能的存储在存储器中的程序,用软 件来实现使用图3、图5、图7、图8、图10、图11等以后说明的荧光强度波 形数据分析部1c的各功能。另外,例如,也可以通过使用集成电路进行设计 等,用硬件来实现荧光强度波形数据分析部1c的各功能、处理部、处理单元 等的一部分或全部。例如,也可以将实现各功能的程序、文件、数据库等信息 放置在存储器、硬盘、SSD(固态驱动器)等记录装置、或IC卡、SD卡、DVD 等记录介质中。

已知信息数据库1d存储与和碱基排列对应的荧光强度波形数据相关联的 信息。控制部1b、1g进行各部间的数据转送的控制、荧光强度波形数据测量 部1a、1f的测量执行控制、荧光强度波形数据分析部1c的分析处理内容的控 制等。并且,也可以与外部网络1e连接来进行用于分析的信息、分析结果的 发送。

另外,在图1中,表示了以下的系统结构,即作为分析装置的荧光强度波 形数据分析部1c经由作为控制装置的控制部1b、1g与作为测量装置的荧光强 度波形数据测量部1a、1f连接,并且与已知信息数据库1d连接来参照数据库 取得数据,但也可以如图9所示那样,作为具备上述的荧光强度波形数据测量 部1a、控制部1b、荧光强度波形数据分析部1c、已知信息数据库1d的基因 变异分析装置1x来实施。

图3是表示图1的荧光强度波形数据分析部1c在决定核酸样本的碱基排 列时,对荧光强度波形数据进行的处理的流程图。针对荧光强度波形数据,首 先进行平滑化处理(3a)和背景消除处理(3b)。然后,进行峰值的检测(3c), 在各位置抽出信号强度。最后,比较各位置的4个碱基种类的信号强度,依照 预定的基准判定主要的信号,由此顺序决定碱基种类(3d)。

在图4中表示某碱基种类的荧光强度波形数据的例子。在数据中包含噪 声,因此不只是在相当于该碱基种类的位置,还在相当于其他碱基种类的位置 抽出信号强度。在图3中,在相当于该碱基种类的峰值位置(例如峰值位置 x1、x2、x3、x4、x5)抽出强的峰值,在存在该碱基种类的微量变异的峰值位 置(例如峰值位置k),伴有噪声信号地抽出因变异造成的微小信号。在本实 施方式中,图1的荧光强度波形数据分析部1c除了上述图3的用于决定碱基 排列的处理以外,还具有以下功能,将从针对已知的碱基排列得到的荧光强度 波形数据中取得的各峰值位置的信号强度相对于其他峰值位置的信号强度的 相对信号强度信息作为指标,判定碱基排列坐标位置的各碱基种类的存在有 无。以下,作为根据上述相对信号强度信息判定碱基排列坐标位置的各碱基种 类的存在有无的本实施方式的具体的结构例子,详细说明检测各排列坐标位置 的基因变异的功能、检测各排列坐标位置的各碱基种类的存在比例的功能。

<实施例1>

在本实施例中,使用图5、图6、图7,作为根据各峰值位置的信号强度 相对于其他峰值位置的信号强度的相对信号强度信息来判定碱基排列坐标位 置的各碱基种类的存在有无的本实施方式的更具体的结构例子,说明由荧光强 度波形数据分析部1c进行的检测荧光强度波形数据的基因变异的分析处理的 一个例子。

首先,使用图5说明数据分析部1c取得参照用的相对信号强度信息的处 理的一个例子,即,说明从针对已知的碱基排列得到的该碱基种类的荧光强度 波形数据中取得相对信号强度信息的处理的一个例子。在此,为了说明峰值位 置等,将图4所示的荧光强度波形数据的波形假定为相当于已知的碱基排列的 荧光强度波形数据来进行说明。

在图5的处理中,首先准备针对已知的碱基排列得到的某碱基种类的多个 荧光强度波形数据组(5a)。根据该数据组,在某峰值位置选择与该峰值(峰 值编号k;4a)相邻的该碱基种类的峰值(峰值编号x1;4b)(5b、5c)。接着, 计算该峰值位置的信号强度I(k)相对于相邻峰值位置的信号强度I(x1)的 相对信号强度I1在数据组内的平均值和标准偏差(5d)。在此,根据以下的式 (1)计算相对信号强度I1

I1=I(k)/I(x1)……(1)

与上述一连串的步骤同样地,在全部的位置,顺序地计算相对信号强度I1在数据组内的平均值和标准偏差(5e、5f),将碱基排列和计算结果保存在已 知信息数据库1d中(5g)。对全部的碱基种类进行同样的处理。

相对信号强度信息既可以选择与该峰值相邻的峰值以外的其他峰值,也可 以使用预先设定的其他峰值来计算。例如,也可以针对某位置,选择相对信号 强度的标准偏差小的峰值。

另外,相对信号强度信息不只是针对上述I1,也可以着眼于位于该峰值近 旁的该碱基种类的多个峰值,针对多个相对信号强度进行计算,保存在已知信 息数据库1d中。例如,可以选择位于该峰值(峰值编号k;4a)近旁的该碱 基种类的5个峰值(峰值编号x1、x2、x3、x4、x5;4b、4c、4d、4e、4f), 计算以下的式(2)~式(6)的5个相对信号强度I1、I2、I3、I4、I5在数据组 内的平均值和标准偏差并保存。

I1=I(k)/I(x1)……(2)

I2=I(x1)/I(x2)……(3)

I3=I(x1)/I(x3)……(4)

I4=I(x3)/I(x4)……(5)

I2=I(x4)/I(x5)……(6)

多个相对信号强度的组合并不限于此,也可以是其他组合。

相对信号强度信息既可以如上述那样由图1的荧光强度波形数据分析部 1c取得,保存在图1的数据库1d中,也可以将由其他装置取得的相对信号强 度信息保存在图1的数据库1d中。

在图6中表示保存针对上述5个相对强度计算出的相对信号强度信息时的 相对信号强度信息的表的一个例子。在该例子中,关于各碱基种类,对于碱基 排列的各坐标位置(6a)将已知的碱基种类(6b)和计算出的相对信号强度的 平均值和标准偏差(6c)保存在表中。例如,与碱基种类A的相对信号强度 有关的表601在各个位置6a,相对应地保存不包含多态性时的该峰值位置的 已知的碱基种类6b(例如在99的位置时T为已知的碱基排列)、在已知的碱 基排列为T的该位置为多态性的碱基种类A的相对信号强度(I1)。并且,如 I2~I3那样,还对应地保存式(3)~(6)的计算结果。以下在后面使用图7说 明这些信息的使用方法。

以下,使用图7,说明荧光强度波形数据分析部1c参照通过上述步骤取 得的用于参照的相对信号强度信息(601~604),对从目标基因的核酸样本新得 到的荧光强度波形数据进行解释,检测某碱基种类的基因变异的处理的一个例 子。

在图7的处理中,首先进行已知碱基排列和新荧光强度波形数据的各峰值 之间的对应(7a)。其中,进行图1的数据库1d中保存的该目标基因的已知碱 基排列和经过图3的处理决定的新荧光强度波形数据的碱基排列的同源性检 索,使已知碱基排列和新荧光强度波形数据的各峰值对应起来。然后,在某位 置,选择新荧光强度波形数据的与该峰值(峰值编号k)相邻的该碱基种类的 峰值(7b、7c),计算相对信号强度I1_new(7d)。相对信号强度I1_new的计算与 针对已知碱基排列使用图5的5d以上所述的相对信号强度的计算处理相同。 另外,对于选择的其他峰值,可以使用相邻的峰值以外的峰值,也可以使用预 先设定的其他峰值进行计算,还可以选择为位于该峰值的近旁的该碱基种类的 多个峰值,针对多个相对信号强度进行计算。

接着,针对各个峰值位置(峰值编号k),从数据库中抽出以上在图6中 说明的已知碱基排列的该峰值位置的相对信号强度信息(7e),根据计算出的 相对信号强度和抽出的相对信号强度信息,检测各峰值位置的基因变异(7f)。 针对各碱基种类执行该处理。与上述一连串步骤同样地,在全部位置顺序地检 测基因变异(7g、7h)。

将根据新荧光强度波形数据计算出的相对信号强度与以上在图6中说明 的根据已知碱基排列的荧光强度波形数据组得到的相对信号强度信息进行比 较,依照下式(7)、(8)的判定基准,进行该基因变异的检测(7f)。例如, 在判定碱基种类G有无变异的情况下,参照表602,针对各位置(6a),依照 式(7)、(8)将碱基种类G的已知的相对强度(I1)和根据新荧光强度波形数 据计算出的碱基种类G的相对信号强度(I1_new)进行比较。

{I1_new–Mean(I1)}/SD(I1)}≥threshold有变异……(7)

{I1_new–Mean(I1)}/SD(I1)}<threshold无变异……(8)

在此,Mean(I1)是根据已知碱基排列的荧光强度波形数据组得到的I1的平均值,SD(I1)是根据已知碱基排列的荧光强度波形数据组得到的I1的标 准偏差,threshold是任意设定的阈值。

此外,也能够根据多个相对信号强度I1、I2、……In,依照将上述判定基 准扩展成多维的下式(10)、(11)的判定基准,进行基因变异的检测。

设为

I=(I1,I2,……In)T……(9)

(I_new–μ)TS-1(I_new–μ)≥threshold有变异……(10)

(I_new–μ)TS-1(I_new–μ)<threshold无变异……(11)

在此,μ是根据已知碱基排列的荧光强度波形数据组得到的I的平均,S 是根据已知碱基排列的荧光强度波形数据组得到的I的方差协方差矩阵, threshold是任意设定的阈值。

可以按照各碱基种类独立地执行上述基因变异检测处理。即,可以针对各 碱基种类,调查全部位置的变异的有无。

在通过DNA序列器得到的荧光强度波形数据中,在一个波形数据中峰值 的信号强度也存在相对大小,但其大小关系具有依存于成为测定对象的基因排 列的特征。即,具有以下的特征,在对由大致相同的基因排列构成的目标基因 进行分析时观察到的同一波形数据中,相对大的峰值不依存于测定的试行而 大,小的峰值不依存于测定而小。可以认为该特征源自上述DNA序列法的原 理。如上述那样,在桑格法的核酸片段化技术中,通过取入作为锁定核苷酸的 双脱氧核苷酸,来使核酸片段化。脱氧核苷酸和双脱氧核苷酸取入容易度的倾 向主要受到模板DNA和DNA合成酶形成的立体构造的影响,立体构造由碱 基的排列的方式决定。因此,与容易取入双脱氧核苷酸的坐标相当的核酸片段 的生成量变多,该坐标的信号强度总是变大。根据以上说明,可以推断出荧光 强度波形数据中的峰值的信号强度的相对大小不依存于测定,主要由碱基排列 来决定。因此,用相邻峰值的信号强度对各峰值的信号强度进行标准化所得到 的相对强度在测定期间的分散小。由此,在使用了相对强度的有无变异的判定 中,能够进行高灵敏度的判定。

以下,通过实施例,加入实验内容地详细说明使用了模型样本的微量基因 变异的检测例子。

(模型样本的调整)

作为模型样本的对象基因,是癌关联基因,选择了成为保险项目检查的对 象的EGFR基因和KRAS基因(各自碱基排列已知)。将从人体大肠癌细胞 (HCT116p21(+))抽出的染色体组DNA作为模板,通过PCR法对EGFR 基因和KRAS基因进行放大,对质粒进行克隆。针对所得到的野生型基因片 段,人工地制成具有针对EGFR基因将858位的C碱基置换为A碱基,针对 KRAS基因将12位的C碱基置换为T碱基后的变异型的基因排列的DNA, 同样进行质粒克隆。使用QIAGEN Plasmid Plus Midi Kit,调制具有各基因排 列的质粒DNA。分别以100%:0%、99%:1%、95%:5%、90%:10%、80%: 20%的比例混合这样得到的野生型和变异型的质粒DNA,制作变异存在比例 不同的核酸样本。

(模型样本的测量)

在本发明的评价中所使用的荧光强度波形数据的测定使用ABI PRISM  BigDye Primer v3.0Ready Reaction Cycle Sequencing Kit For M13REV Primers, 针对各个存在比例样本进行8次标记反应,通过3130基因分析仪,用各碱基 种类各自独立的毛细管进行检测。由此,针对各存在比例的各碱基种类,取得 8个荧光强度波形数据(EPF格式数据)。

(荧光强度波形数据处理)

针对所得到的荧光强度波形数据,分别进行图3所示的处理,检测峰值。

(相对信号强度信息的取得)

针对EGFR基因的碱基种类A,使用存在比例0%的8个荧光强度波形数 据,选择位于变异位置(峰值编号k;3a)近旁的碱基种类A的5个峰值(峰 值编号x1、x2、x3、x4、x5;3b、3c、3d、3e、3f),计算式(2)~(6)的相 对信号强度I1、I2、I3、I4、I5的平均值和标准偏差并保存。同样,针对EGFR 基因的碱基种类C,使用存在比例100%的8个荧光强度波形数据,选择位于 变异位置近旁的碱基种类C的5个峰值,计算式(2)~(6)的相对信号强度 I1、I2、I3、I4、I5的平均值和标准偏差并保存。

另外,针对KRAS基因的碱基种类T,使用存在比例0%的8个荧光强度 波形数据,选择位于变异位置近旁的碱基种类T的5个峰值,计算式(2)~ (6)的相对信号强度I1、I2、I3、I4、I5的平均值和标准偏差并保存。

另外,同样针对KRAS基因的碱基种类C,使用存在比例100%的8个荧 光强度波形数据,选择位于变异位置近旁的碱基种类C的5个峰值,计算式 (2)~(6)的相对信号强度I1、I2、I3、I4、I5的平均值和标准偏差并保存。

(变异的检测)

关于EGFR基因的碱基种类A,针对存在比例0%、1%、5%、10%、20% 的荧光强度波形数据分别进行变异的检测。首先,选择位于变异位置近旁的碱 基种类A的5个峰值,计算式(2)~(6)的相对信号强度I1_new、I2_new、I3_new、 I4_new、I5_new。然后,根据EGFR基因的碱基种类A的相对信号强度信息,依 照式(7)、(8)的判定基准判定变异的有无。这时,设threshold(阈值)=3。 并且,依照式(10)、(11)的判定基准,判定变异的有无。这时,设threshold (阈值)=16.75。同样,关于EGFR基因的碱基种类C,针对存在比例100%、 99%、95%、90%、80%的荧光强度波形数据分别进行变异的检测。

另外,关于KRAS基因的碱基种类T,针对存在比例0%、1%、5%、10%、 20%的荧光强度波形数据分别进行变异的检测。另外,同样地,关于KRAS基 因的碱基种类C,针对存在比例100%、99%、95%、90%、80%的荧光强度波 形数据分别进行变异的检测。

结果,在依照式(7)、(8)的判定基准判定有无变异的情况下,关于变异 存在比例0%,能够判定在全部数据中没有变异,关于变异存在比例5%、10%、 20%,能够判定为在全部数据中有变异。另一方面,关于变异存在比例1%, 检测率减少。与此相对,在依照式(10)、(11)的判定基准判定有无变异的情 况下,关于变异存在比例0%,能够判定在全部数据中没有变异,关于变异存 在比例1%、5%、10%、20%,能够判定在全部数据中有变异。基于现有的数 据分析软件的变异检测限界是变异存在比例30%左右,通过本发明的方法,变 异检测限界大幅提高。

<实施例2>

在本实施例中,作为根据各峰值位置的信号强度相对于其他峰值位置的信 号强度的相对信号强度信息,判定碱基排列坐标位置的各碱基种类的存在有无 的本实施方式的更具体的结构例子,使用图8、图9、图10、图11、图12说 明荧光强度波形数据分析部1c进行的关于荧光强度波形数据检测各排列坐标 位置的各碱基种类的存在比例的分析处理的一个例子。

首先,使用图8和图9,说明取得用于参照的相对信号强度信息的处理的 一个例子,即根据针对已知的碱基排列得到的该碱基种类的荧光强度波形数据 取得相对信号强度信息的处理的一个例子。

在图8的处理中,首先,准备针对按照已知的存在比例包含变异的已知的 碱基排列得到的某碱基种类的多个荧光强度波形数据组(8a)。根据该数据组, 在某位置,选择与该峰值相邻的该碱基种类的峰值(8b、8c)。接着,导出该 峰值位置的信号强度I(k)相对于相邻峰值位置的信号强度I(x1)的相对信 号强度I1和存在比例之间的回归式及其标准偏差(8d)。在此,根据式(14) 计算相对信号强度I1和存在比例R之间的回归式(式12)及其标准偏差(式 13)。

I1=a(R-Mean(R))+Mean(I1)……(12)

σ2=1/(n-2)Σ(I1_i-I1)2……(13)

a={Σ(R_i-Mean(R))(I1_i-Mean(I1))}/Σ(R_i-Mean(R))2…… (14)

在此,n是已知碱基排列的荧光强度波形数据数,I1_i是已知碱基排列的 荧光强度波形数据第i个I1,Mean(I1)是根据已知碱基排列的荧光强度波形 数据组得到的I1的平均值,R_i是已知碱基排列的荧光强度波形数据第i个的 R,Mean(R)是根据已知碱基排列的荧光强度波形数据组得到的R的平均值。 与上述一连串步骤同样地,在全部位置,顺序地导出相对信号强度I1和存在比 例之间的回归式及其标准偏差(8e、8f),保存碱基排列和导出结果(8g)。对 全部碱基种类进行同样的处理。

在图11中表示保存与针对上述相对强度导出的回归式及其标准偏差相关 的相对信号强度信息时的相对信号强度信息的表的一个例子。在该例子中,关 于各碱基种类,针对碱基排列的各坐标位置(11a),将已知的碱基种类(11b)、 导出的相对强度和存在比例之间的回归式(式(12))的斜率a、存在比例的 平均值Mean(R)、相对强度的平均值Mean(I1)、回归式的标准偏差(式(13))、 (11c)保存在表中。例如,与碱基种类A的相对信号强度有关的表1101在各 个位置11a,相对应地保存不包含多态性时的在该峰值位置的已知的碱基种类 11b(例如在99的位置时T为已知的碱基排列)、在已知的碱基排列是T的该 位置为多态性的碱基种类A的与相对信号强度(I1)和存在比例之间的回归式 及其标准偏差相关的信息。以下,将在后面使用图10说明这些信息的使用方 法。

相对信号强度信息既可以由图1的荧光强度波形数据分析部1c取得而保 存在图1的数据库1d中,也可以将由其他装置取得的相对信号强度信息保存 在图1的数据库1d中。

以下,使用图10说明以下的处理的一个例子,即参照通过上述步骤取得 的相对信号强度和存在比例的回归式及其标准偏差,对从目标基因的核酸样本 新取得的荧光强度波形数据进行解释,推定某碱基种类的基因变异的存在比 例。

在图10的处理中,首先进行已知碱基排列和新荧光强度波形数据的各峰 值之间的对应(10a)。其中,对图1的数据库1d中保存的该目标基因的已知 碱基排列和经过图3的处理决定的新荧光强度波形数据的碱基排列进行同源 性检索,使已知碱基排列和新荧光强度波形数据的各峰值对应起来。

然后,在某位置,选择新荧光强度波形数据的与该峰值(峰值编号k)相 邻的该碱基种类的峰值(10b、10c),计算相对信号强度I1_new(10d)。

接着,从数据库1d中抽出与针对该峰值位置的回归式及其标准偏差有关 的信息(10e),根据计算出的相对信号强度和与抽出的回归式及其标准偏差相 关的信息,推定各峰值位置的基因变异的存在比例(10f)。与上述一连串步骤 同样地,在全部位置顺序地推定基因变异的存在比例(10g、10h)。

根据从新荧光强度波形数据计算出的相对信号强度,基于从以上通过图 11说明的已知碱基排列的荧光强度波形数据组得到的相对信号强度信息,依 照以下的式(15)、式(16)进行该基因变异的存在比例的推定(10f)。例如, 在推定碱基种类G的变异存在比例的情况下,参照表1102,针对各位置(11a), 根据从新荧光强度波形数据计算出的碱基种类G的相对信号强度(I1_new), 基于与碱基种类G的回归式及其标准偏差有关的信息,依照式(15)、(16) 进行推定。

R_new=(I1_new-Mean(I1))/a+Mean(R)……(15)

σ2(R_new)=σ2/a2……(16)

在图12中,表示针对目标基因的核酸样本输出通过上述方法得到的各碱 基种类的各位置的变异存在比例时的显示例子。在该例子中,针对碱基排列的 各坐标位置,分别显示已知的碱基种类(12a)、在该位置得到的全部碱基种类 的存在比例(12b、12c、12d、12e)。

到此为止,说明了推定基因变异的存在比例的情况。

<实施例3>

在本实施例中,作为根据各峰值位置的信号强度相对于其他峰值位置的信 号强度的相对信号强度信息判定碱基排列坐标位置的各碱基种类的存在有无 的本实施方式的应用例子,说明向DNA甲基化修饰状态的检测的应用。

现有的DNA甲基化基因的检测的一般方法如下:(i)通过亚硫酸氢盐处 理将DNA中没有甲基化的胞嘧啶C(非甲基化胞嘧啶)变换为尿嘧啶U,(ii) 将变换后的DNA样本作为模板,通过PCR进行的基因放大,(iii)基因放大 的产物的质粒克隆,(iv)约100克隆的质粒DNA的调整,(v)约100克隆的 荧光标记反应,(vi)通过NDA序列器对荧光标记产物的分析,(vii)基于所 决定的碱基排列,通过将变换尿嘧啶U的出现数和未变换胞嘧啶C的出现数 进行比较来计算甲基化率。

如果将能够检测微量存在的基因变异的本发明应用于甲基化基因检测,则 其步骤为:(i)通过亚硫酸氢盐处理将DNA中没有甲基化的胞嘧啶C(非甲 基化胞嘧啶)变换为尿嘧啶U,(ii)将变换后的DNA样本作为模板,通过PCR 进行基因放大,(iii)基因放大的产物的荧光标记反应,(iv)通过NDA序列 器对荧光标记产物的分析,(v)通过将源自变换尿嘧啶U的相对信号强度和 源自未变换胞嘧啶C的相对信号强度进行比较来计算甲基化率。即,以克隆 为例子能够缩短工序,将所分析的样本数从约100克隆削减为1克隆。以下, 说明具体的实施方式。

首先,说明通过目标基因分析来生产参照信息。针对成为目标的基因,关 于不进行亚硫酸氢盐处理的情况和进行亚硫酸氢盐处理的情况的双方,收集参 照荧光强度波形数据。在不进行亚硫酸氢盐处理的情况下,将排列中的胞嘧啶 C全部判定为胞嘧啶C。即,全部的胞嘧啶C成为进行了甲基化的情况下的参 照信息。在进行亚硫酸氢盐处理的情况下,将排列中的胞嘧啶C全部判定为 尿嘧啶U,全部的胞嘧啶C成为不进行甲基化的情况下的参照信息。

接着,说明来自检测体的样本的调整。针对来自检测体的染色体组DNA 样本,在进行亚硫酸氢盐处理后,进行目标区域基因区域的放大。作为基因放 大方法,能够利用普通的PCR法,但为了通过亚硫酸氢盐处理将非甲基化胞 嘧啶变换为尿嘧啶,理想的是引物设计考虑到基于亚硫酸氢盐处理的碱基排列 变换。

接着,说明检测体的甲基化基因检测。如在实施例1中说明的那样,使用 参照荧光强度波形数据,针对全部碱基种类,通过图5所示的处理,取得各位 置的相对信号强度信息。然后,将检测体荧光强度波形数据作为输入,通过图 7所示的处理,计算各位置的相对信号强度,进行从胞嘧啶C向尿嘧啶U的 变换的检测,由此判定各位置的DNA甲基化的有无。另外,也可以与实施例 2同样地,根据其存在比例来推定甲基化率。

符号说明

1a、1f:荧光强度波形数据测量部;1b、1g:控制部;1c:荧光强度波形 数据分析部;1d:已知信息数据库;1e:外部网络;1h:通信线路;1x:基因 变异分析装置;2b:流路;2c:检测器;601:关于碱基种类A的相对信号强 度信息;602:关于碱基种类G的相对信号强度信息;603:关于碱基种类C 的相对信号强度信息;604:关于碱基种类T的相对信号强度信息

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号