首页> 中国专利> 确定多核苷酸的碱基序列的方法和确定多核苷酸的碱基序列的装置

确定多核苷酸的碱基序列的方法和确定多核苷酸的碱基序列的装置

摘要

针对多核苷酸在电极对之间通过时产生的隧穿电流的多个脉冲,对各脉冲测定最大电流值和脉冲持续时间,基于该最大电流值和脉冲持续时间确定多核苷酸的碱基序列。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-11-19

    专利权的转移 IPC(主分类):G01N27/00 登记生效日:20191031 变更前: 变更后: 申请日:20130329

    专利申请权、专利权的转移

  • 2018-12-28

    授权

    授权

  • 2016-05-04

    专利申请权的转移 IPC(主分类):G01N27/00 登记生效日:20160411 变更前: 变更后: 申请日:20130329

    专利申请权、专利权的转移

  • 2015-04-08

    实质审查的生效 IPC(主分类):G01N27/00 申请日:20130329

    实质审查的生效

  • 2014-01-01

    公开

    公开

说明书

技术领域

本发明涉及确定多核苷酸的碱基序列的方法和确定多核苷酸的碱基序列的装置。更具体而言,本发明涉及基于多核苷酸在电极对之间通过时产生的隧穿电流来确定多核苷酸的碱基序列的方法和用于实施该方法的装置。

背景技术

分析多核苷酸的碱基序列的技术不单单局限于学术性研究的领域,还应用到了医疗、药物开发和刑事侦查等领域中,对该技术的发展的关注正在提高。

现有的多核苷酸(具体而言为DNA)的测序仪基于识别荧光标记的光测定技术,并不能直接识别形成多核苷酸的核苷酸本身。因此,如果要利用现有的测序仪分析多核苷酸的碱基序列,需要以该多核苷酸为模板进行PCR并且对利用该PCR延伸的多核苷酸附加荧光标记。该操作不仅需要多种试剂,而且还需要大量时间。因此,利用现有的测序仪分析多核苷酸的碱基序列需要庞大的资金和时间。

因此,在过去十几年间,进行了想要开发使用1分子多核苷酸直接分析构成该多核苷酸的核苷酸的技术的尝试。

例如,进行了想要开发通过使用以化学方法设计的α-溶血素的纳米级的孔(以下称为“纳米孔”)的离子电流的检测,分析多核苷酸的碱基序列的技术的尝试(参考非专利文献1~5)。但是,该技术存在(1)孔径的选择受限、(2)系统不稳定等诸多问题,尚未得到实用化。

在这种情况下,进行了想要基于使多核苷酸在非常狭窄的电极对之间的空间通过时产生的“隧穿电流”来分析多核苷酸的碱基序列的新的尝试(例如,参考专利文献1、非专利文献6)。该技术是基于作为与“离子电流”完全不同的电流的隧穿电流对多核苷酸的碱基序列进行分析的技术,是构思与非专利文献1~5等中记载的技术完全不同的技术。

现有技术文献

专利文献

专利文献1:WO 2011/108540A1(公开日:2011年9月9日)

非专利文献

非专利文献1:J.Li,D.Stein,C.McMullan,D.Branton,M.J.Aziz,J.A.Golovchenko,Nature 412,166(2001)

非专利文献2:A.J.Storm,J.H.Chen,X.S.Ling,H.W.Zandbergen,C.Dekker,Nature Mat.2,537(2003)

非专利文献3:C.Dekker,Nat.NanotechnoL.2,209(2007)

非专利文献4:D.Branton,D.W.Deamer,A.Marziali,H.Bayley,S.A.Benner,T.Butler,M.Di Ventra,S.Garaj,A.Hibbs,X.Huang,S.B.Jovanovich,P.S.Krstic,S.Lindsay,X.S.Ling,C.H.Mastrangelo,A.Meller,J.S.Oliver,Y.V.Pershin,J.M.Ramsey,R.Riehn,G.V.Soni,V.Tabard-Cossa,M.Wanunu,M.Wiggin,J.A.Schloss,Nat.Biotech.26,1146(2008)

非专利文献5:M.Zwolak,M.Di Ventra,Rev.Mod.Phys.80,141(2008)

非专利文献6:Nature Nanotechnology,2010,April,5(4),286-290

发明内容

发明所要解决的问题

然而,上述基于隧穿电流对多核苷酸的碱基序列进行分析的技术虽然适合确定核苷酸或短的多核苷酸的碱基序列,但尚未确立用于使用该技术确定长的多核苷酸的碱基序列的方法,因此,需要迅速地确立该方法。

本发明是鉴于上述问题而完成的,其目的在于确立用于使用基于隧穿电流对多核苷酸的碱基序列进行分析的技术来确定长的多核苷酸的碱基序列的方法和装置。

用于解决问题的方法

为了解决上述问题,本发明的确定多核苷酸的碱基序列的方法的特征在于,具有:第一步骤,使上述多核苷酸在电极对之间通过;第二步骤,检测上述多核苷酸在上述电极对之间通过时产生的隧穿电流的多个脉冲、并且针对该多个脉冲的各脉冲测定最大电流值和脉冲持续时间;第三步骤,通过将上述多个脉冲的最大电流值之间的大小顺序、和与起因于各个核苷酸与形成上述电极对的金属的能级差的电子状态相对应的参考电流值之间的大小顺序进行比较,作成将上述多个脉冲的各脉冲对应为特定种类的核苷酸的一级碱基序列信息;第四步骤,从上述多个脉冲中提取由上述脉冲持续时间相连续的脉冲构成的脉冲群、并且从上述一级碱基序列信息中提取与上述脉冲群对应的多个二级碱基序列信息;第五步骤,检索出在上述多个二级碱基序列信息中的至少两个二级碱基序列信息之间共有的碱基序列;和第六步骤,通过上述共有的碱基序列将具有上述共有的碱基序列的上述二级碱基序列信息彼此相连。

为了解决上述问题,本发明的确定多核苷酸的碱基序列的装置的特征在于,具有:能够使多核苷酸通过的电极间距的电极对;检测上述多核苷酸在上述电极对之间通过时产生的隧穿电流的多个脉冲、并且针对该多个脉冲的各脉冲测定最大电流值和脉冲持续时间的测定部;通过将上述多个脉冲的最大电流值之间的大小顺序、和与起因于各个核苷酸与形成上述电极对的金属的能级差的电子状态相对应的参考电流值之间的大小顺序进行比较,作成将上述多个脉冲的各脉冲对应为特定种类的核苷酸的一级碱基序列信息的一级碱基序列信息作成部;从上述多个脉冲中提取由上述脉冲持续时间相连续的脉冲构成的脉冲群、并且从上述一级碱基序列信息中提取与上述脉冲群对应的多个二级碱基序列信息的二级碱基序列信息提取部;检索在上述多个二级碱基序列信息中的至少两个二级碱基序列信息之间共有的碱基序列的共有序列检索部;和通过上述共有的碱基序列将具有上述共有的碱基序列的上述二级碱基序列信息彼此相连的序列信息连结部。

发明效果

本发明起到了能够从DNA这样的多核苷酸直接地读取碱基序列的信息自不必说、而且还能够从RNA这样的多核苷酸直接地读取碱基序列的信息的效果。

本发明能够省略现有技术中需要的多核苷酸(例如DNA)的提取操作和纯化操作、并且能够省略使用该多核苷酸的PCR反应,因此,起到能够简便且在短时间内确定多核苷酸的碱基序列的效果。

本发明不需要以往的鸟枪测序法这样的多核苷酸的切断处理,因此,起到能够简便且在短时间内确定多核苷酸的碱基序列的效果。

本发明起到即使是受修饰的多核苷酸或受损伤的多核苷酸也能够确定其碱基序列的效果。

本发明起到能够从多核苷酸直接得到基因的表达信息和有关老化或疾病的表观遗传信息的效果。

本发明起到即使是极微量的多核苷酸(例如,1分子的DNA或RNA)也能够确定其碱基序列的效果。

本发明使用不需要生物分子、机械强度高的电极来确定碱基序列,因此,起到能够稳定地确定多核苷酸的碱基序列的效果。

本发明起到即使在例如使生物分子变性这样的条件下(例如,将形成在DNA或RNA分子间等的氢键切断这样的高温条件下)也能够稳定地确定多核苷酸的碱基序列的效果。

本发明不需要用于主动将多核苷酸导入电极间的装置、用于清洗电极的装置,因此,起到能够利用小型的装置确定多核苷酸的碱基序列、并且能够廉价地确定多核苷酸的碱基序列的效果。

附图说明

图1是表示在电极对之间通过的多核苷酸的示意图。

图2是表示本发明的实施例的各种数据的图。

图3是表示本发明的实施例的各种数据的图。

图4是表示本发明的实施例的各种数据的图。

图5是表示本发明的实施例的确定多核苷酸的碱基序列的装置的构成的一例的框图。

图6是表示本发明的实施例的确定多核苷酸的碱基序列的装置的动作的一例的流程图。

具体实施方式

以下,对本发明的一个实施方式进行说明,但本发明并不限定于此。

[1.确定多核苷酸的碱基序列的方法]

本发明的确定多核苷酸的碱基序列的方法包括以下的第一步骤~第六步骤。即,

第一步骤:使多核苷酸在电极对之间通过的步骤。

第二步骤:检测多核苷酸在电极对之间通过时产生的隧穿电流的多个脉冲、并且针对该多个脉冲的各脉冲测定最大电流值和脉冲持续时间的步骤。

第三步骤:通过将多个脉冲的最大电流值之间的大小顺序、和与起因于各个核苷酸(称为参考核苷酸)与形成电极对的金属的能级差的电子状态相对应的参考电流值之间的大小顺序进行比较,作成将上述多个脉冲的各脉冲对应为特定种类的核苷酸的一级碱基序列信息的步骤。

第四步骤:从多个脉冲中提取由脉冲持续时间相连续的脉冲构成的脉冲群、并且从一级碱基序列信息中提取与上述脉冲群对应的多个二级碱基序列信息的步骤。

第五步骤:检索出在多个二级碱基序列信息中的至少两个二级碱基序列信息之间共有的碱基序列的步骤。

第六步骤:通过共有的碱基序列将具有该共有的碱基序列的二级碱基序列信息彼此相连的步骤。

以下,对各步骤进行说明。

[1-1.第一步骤]

第一步骤是使多核苷酸在电极对之间通过的步骤。

在本说明书中使用的情况下,术语“多核苷酸”能够与“寡核苷酸”、“基因”交换使用,表示核苷酸的聚合物。另外,在本说明书中使用的情况下,“寡核苷酸”表示由2个~数十个核苷酸构成的聚合物,更具体而言,表示由2个~50个核苷酸构成的聚合物。“多核苷酸”表示由数十个以上的核苷酸构成的聚合物,具体而言,表示由多于50个核苷酸构成的聚合物。

构成上述多核苷酸的核苷酸没有特别限定,可以是任意的核糖核苷酸,也可以是任意的脱氧核糖核苷酸。另外,构成上述多核苷酸的核苷酸可以是受到化学修饰(例如,甲基化、氧代化、羟化、甲酰化、羧化、二聚化、脱碱基化等)的核糖核苷酸或脱氧核糖核苷酸。

作为核糖核苷酸,没有特别限定,可以列举:单磷酸腺苷(rAMP)、二磷酸腺苷(rADP)、三磷酸腺苷(rATP)、单磷酸鸟苷(rGMP)、二磷酸鸟苷(rGDP)、三磷酸鸟苷(rGTP)、单磷酸胞苷(rCMP)、二磷酸胞苷(rCDP)、三磷酸胞苷(rCTP)、单磷酸尿苷(rUMP)、二磷酸尿苷(rUDP)和三磷酸尿苷(rUTP)等。

作为作为脱氧核糖核苷酸,没有特别限定,可以列举:单磷酸脱氧腺苷(dAMP)、二磷酸脱氧腺苷(dADP)、三磷酸脱氧腺苷(dATP)、单磷酸脱氧鸟苷(dGMP)、二磷酸脱氧鸟苷(dGDP)、三磷酸脱氧鸟苷(dGTP)、单磷酸脱氧胞苷(dCMP)、二磷酸脱氧胞苷(dGDP)、三磷酸脱氧胞苷(dCTP)、单磷酸脱氧尿苷(dUMP)、二磷酸脱氧尿苷(dUMP)、二磷酸脱氧尿苷(dUTP)、一磷酸脱氧胸苷(dTMP)、二磷酸脱氧胸苷(dTDP)和三磷酸脱氧胸苷(dTTP)等。

作为受到化学修饰的核糖核苷酸或脱氧核糖核苷酸,没有特别限定,可以列举:甲基胞嘧啶、甲基腺嘌呤、氧代鸟嘌呤、羟甲基胞嘧啶、胸腺嘧啶二聚体、甲基腺嘌呤、甲酰基胞嘧啶以及从核糖核苷酸或脱氧核糖核苷酸上脱去碱基后的物质等。

第一步骤中,使上述的多核苷酸溶解在溶液中,将该溶液填充到形成上述电极对的电极之间或者将电极对保持在上述溶液中,由此使多核苷酸在电极对之间通过即可。

作为上述溶液,没有特别限定,可以列举例如超纯水。超纯水可以通过使用例如密理博公司的Milli-Q Integral 3(装置名称)(Milli-QIntegral 3/5/10/15(目录号))来制作。溶液中的多核苷酸的浓度没有特别限定,例如为0.01~1.0μM。当然,只要溶液中含有1分子的多核苷酸,就可以分析该多核苷酸的碱基序列。

第一步骤中,向电极对之间施加电压。由此,在多核苷酸通过该电极对之间时,在形成该电极对的电极间产生隧穿电流。施加的电压没有特别限定,例如可以为0.25V~0.75V。

第一步骤中,使上述的多核苷酸在电极对之间通过。

使多核苷酸在电极对之间通过的具体的方法没有特别限定,例如,可以通过热扩散(换言之为布朗运动)或交流电压等使多核苷酸移动,通过该移动使其在电极对之间通过。其中,优选通过热扩散使多核苷酸移动并通过该移动使其在电极对之间通过。通过上述构成,能够使多核苷酸长时间存在于电极对之间,因此,能够更多地获得多核苷酸的部分序列的信息。结果,能够更长且精度更高地确定多核苷酸的碱基序列。

使多核苷酸发生热扩散的情况下的温度没有特别限定,可以适当设定。例如,优选为5℃~70℃,更优选为20℃~50℃。

不同于现有技术,本发明不需要具有由蛋白质形成的孔的电极,因此,即使在高温下使多核苷酸热扩散,也不会使电极丧失功能。而且,如果在高温下使多核苷酸热扩散,则能够防止多核苷酸的分子间发生相互作用(例如氢键)。即,如果在高温下使多核苷酸热扩散,则能够防止多核苷酸形成双链。结果,能够更准确地确定多核苷酸的碱基序列。

接着,对本实施方式中使用的电极对进行说明。

为了实施本实施方式,需要在多核苷酸通过时使电极对之间产生隧穿电流。为了产生这样的隧穿电流,电极对之间的距离很重要。电极对之间的距离与构成多核苷酸的各核苷酸的分子直径相比过长时,隧穿电流难以流过电极对之间,或者2个以上的多核苷酸会同时进入电极对之间。相反地,电极对之间的距离与构成多核苷酸的各核苷酸的分子直径相比过短时,多核苷酸无法进入电极对之间。

电极对之间的距离与构成多核苷酸的各核苷酸的分子直径相比过长或过短时,难以检测来自于1分子的构成多核苷酸的各核苷酸介导的隧穿电流的脉冲。因此,形成电极对的电极间的距离优选为稍短于、等于或稍长于构成多核苷酸的核苷酸的分子直径的程度。例如,电极间的距离为核苷酸的分子直径的0.5倍~2倍的长度,优选为1倍~1.5倍的长度,更优选为1倍~1.2倍的长度。

核苷酸的分子直径是本领域技术人员公知的,因此,接触到本说明书的本领域技术人员可以适当选择最佳的电极对之间的距离。例如,单磷酸形态的核苷酸的分子直径为约1nm,因此,以该分子直径为基准,将电极对之间的距离设定为例如0.5nm~2nm、优选为1nm~1.5nm、更优选为1nm~1.2nm即可。

另外,上述电极对优选为电极间的距离保持恒定的电极对(或者,能够将电极间的距离控制为恒定的电极对)。即,上述电极对优选为测定隧穿电流时电极间的距离不发生变化的电极对。

例如,优选电极间的距离的变化率为1%以下的电极对,更优选电极间的距离的变化率为0.1%以下的电极对,进一步优选电极间的距离的变化率为0.01%以下的电极对,更进一步优选电极间的距离的变化率为0.001%以下的电极对。

利用现有技术制作的电极对在用肉眼观察的情况下,乍看起来电极间的距离像是保持恒定,但实际上电极间的距离微细地发生变化。而且,即使电极间的距离发生微细的变化,隧穿电流的值也会变动。即,来源于相同物质的隧穿电流的值发生变化,多核苷酸的碱基序列的确定精度降低。

另一方面,如果使用电极间的距离能够保持恒定的电极对,则能够使多核苷酸的碱基序列的确定精度达到更高的精度。

另外,这样的电极对可以通过本发明人开发的技术(例如,后述的纳米加工机械可控断结法)容易地制作。关于该技术的详细内容,在后面记述。

上述电极对的具体的制作方法没有特别限定。以下,示出制作方法的一例。

上述的电极对可以通过使用公知的纳米加工机械可控断结法(nanofabricated mechanically-controllable break junctions)来制作。该纳米加工机械可控断结法是能够以皮米以下的分辨率控制机械稳定性优良的电极间距的优良的方法。使用纳米加工机械可控断结法的电极对的制作方法记载在例如J.M.van Ruitenbeek,A.Alvarez,I.Pineyro,C.Grahmann,P.Joyez,M.H.Devoret,D.Esteve,C.Urbina,Rev.Sci.Instrum.67,108(1996)或M.Tsutsui,K.Shoji,M.Taniguchi,T.Kawai,Nano Lett.8,345(2008)中。作为电极的材料,可以列举金等任意的金属。

例如,可以通过以下所示的步骤制作电极对。

首先,使用电子束光刻装置(日本电子公司制造,目录号:JSM6500F),通过公知的电子束光刻法和剥离技术在由聚酰亚胺包覆的挠性金属基板上图案成形纳米级的金的接头。接着,使用反应性离子蚀刻装置(サムコ公司制造,目录号:10NR),通过基于公知的蚀刻法(反应性离子蚀刻法等)的蚀刻将位于该接头的下方的聚酰亚胺除去。

然后,将基板弯曲,由此制作利用3点弯曲的结构的纳米级金桥。这种情况下,通过使用压电驱动器(CEDRAT公司制造,目录号:APA150M)精密地操作基板的弯曲,能够以皮米以下的分辨率控制电极对的电极间距。

接着,对制作好的该桥进行拉伸。使桥的一部分断裂。进一步拉伸桥,将因断裂而产生的间隙的大小(电极间距)设定为目标核苷酸分子的长度(约1nm)。这种情况下,通过利用自断裂技术调节桥的拉伸,能够准确地控制电极对的电极间距(参考M.Tsutsui,K.Shoji,M.Taniguchi,T.Kawai,Nano Lett.8,345(2008)和M.Tsutsui,M.Taniguchi,T.Kawai,Appl.Phys.Lett.93,163115(2008))。

具体而言,使用数据采集板(美国国家仪器公司制造,目录号:NIPCIe-6321),通过电阻反馈法(参考M.Tsutsui,K.Shoji,M.Taniguchi,T.Kawai,Nano Lett.8,345(2008)和M.Tsutsui,M.Taniguchi,T.Kawai,Appl.Phys.Lett.93;163115(2008)),在程控的接头的拉伸速度下,使用10kΩ的串联电阻对该桥施加0.1V的DC偏压(Vb),对金的纳米接头进行拉伸,使桥断裂。然后,进一步拉伸桥,将因断裂而产生的间隙的大小(电极间距)设定为目标核苷酸分子的长度。这样,形成电极对。

[1-2.第二步骤]

第二步骤是检测多核苷酸在电极对之间通过时产生的隧穿电流的多个脉冲、并且针对该多个脉冲的各脉冲测定最大电流值和脉冲持续时间的步骤。

第二步骤中检测的脉冲数没有特别限定,脉冲数越多,越能够以良好的精度确定多核苷酸的全长碱基序列。另外,为了增大检测的脉冲数,例如,延长测定隧穿电流的时间即可。测定隧穿电流的时间没有限定,例如,可以为10分钟、20分钟、30分钟、40分钟、50分钟、1小时。上述时间根据多核苷酸的长度适当设定即可。

以下,对隧穿电流的具体的测定方法进行说明。

例如,如果将电极对保持在溶解有多核苷酸的溶液中并向电极对之间施加电压(例如,0.25V~0.75V),则在多核苷酸通过电极对之间时,电极对之间会产生起因于构成多核苷酸的核苷酸的隧穿电流。以下对产生隧穿电流(多个隧穿电流)的机制进行说明。

多核苷酸进入电极对之间时,首先,构成多核苷酸的任意一个核苷酸(以下,称为第1号核苷酸)在电极间被捕获。第1号核苷酸在电极间被捕获时,电极间产生起因于第1号核苷酸的隧穿电流。

需要说明的是,该第1号核苷酸有时为多核苷酸的5’末端的核苷酸,有时为多核苷酸的3’末端的核苷酸,有时为存在于5’末端与3’末端之间的核苷酸。

然后,在第1号核苷酸完全通过电极对之间后,另一核苷酸在电极间被捕获(以下,称为第2号核苷酸)。第2号核苷酸在电极对之间被捕获时,电极间产生起因于第2号核苷酸的隧穿电流。

需要说明的是,上述第2号核苷酸有时为与上述第1号核苷酸邻接的核苷酸,有时为不与上述第1号核苷酸邻接的核苷酸。第2号核苷酸是否为与第1号核苷酸邻接的核苷酸可以基于脉冲持续时间来判定,关于这一点在后面记述。

如上所述,在电极对之间产生起因于构成多核苷酸的核苷酸的隧穿电流。

然后,当多核苷酸在电极对之间通过时(构成多核苷酸的最后的核苷酸从电极对上解离时),在电极对之间产生的隧穿电流消失。

在电极对之间产生的隧穿电流的测定可以使用公知的电流计来测定。另外,可以使用电流放大器暂时将隧穿电流的信号放大。通过使用电流放大器,能够将微弱的隧穿电流的值放大,因此,能够高灵敏度地测定隧穿电流。作为电流放大器,可以列举例如市售的可调高速电流放大器(Femto公司制造,目录号:DHPCA-100)。

对在电极对之间流过的隧穿电流进行预定时间的测定,随时间推移判定隧穿电流的电流值是否超过基础水平,由此能够检测隧穿电流的脉冲。具体而言,可以根据上述的判定,确定隧穿电流超过基础水平的时间,并且确定再次恢复到基础水平的时间,检测这两个时间之间的信号作为起因于核苷酸的隧穿电流的脉冲。使用表示测定的隧穿电流的电流值与隧穿电流的测定时间的关系的图(例如曲线图)时,能够通过目视容易地进行这样的判定。

图2(b)中示出了隧穿电流的脉冲的一例。如图2(b)所示,由表示测定的隧穿电流的电流值与隧穿电流的测定时间的关系的图,能够计算出各脉冲的最大电流值(Ip)和脉冲持续时间(tp)。

[1-3.第三步骤]

第三步骤是通过将多个脉冲的最大电流值之间的大小顺序、和与起因于各个核苷酸(称为参考核苷酸)与形成电极对的金属的能级差的电子状态相对应的参考电流值之间的大小顺序进行比较,作成将多个脉冲的各脉冲对应为特定种类的核苷酸的一级碱基序列信息的步骤。

另外,第三步骤也可以是通过将多个脉冲的最大电流值之间的大小顺序与各个核苷酸(称为参考核苷酸)的参考电流值之间的大小顺序进行比较,作成将多个脉冲的各脉冲对应为特定种类的核苷酸的一级碱基序列信息的步骤。

例如,预先确定结构已知的4种参考核苷酸的各自的参考电流值A、B、C和D,其大小关系设定为A<B<C<D。而且,测定的多个脉冲的最大电流值各自可以分类为a、b、c或d,且设定这些最大电流值存在a<b<c<d的大小关系。

这种情况下,可以判断最大电流值a所对应的核苷酸与参考电流值A所对应的参考核苷酸为相同的核苷酸,可以判断最大电流值b所对应的核苷酸与参考电流值B所对应的参考核苷酸为相同的核苷酸,可以判断最大电流值c所对应的核苷酸与参考电流值C所对应的参考核苷酸为相同的核苷酸,可以判断最大电流值d所对应的核苷酸与参考电流值D所对应的参考核苷酸为相同的核苷酸。

由于参考核苷酸的结构是已知的,因此,能够将测定的各脉冲与特定种类的核苷酸对应起来。

需要说明的是,上述第三步骤可以包括判定多个脉冲的最大电流值的种类(上述的例中为4种)与参考电流值的种类(上述的例中为4种)是否为相同数量的步骤。在多个脉冲的最大电流值的种类与参考电流值的种类为相同数量的情况下,能够精度更高地确定多核苷酸的碱基序列。

参考电流值的大小关系可以根据电极对的材料来确定。

例如,在电极对为金电极的情况下,参考电流值的大小顺序在核苷酸(参考核苷酸)为DNA的情况下可以为dTMP<dCMP<dAMP<甲基dAMP<dGMP<氧代dGMP<甲基dCMP,在核苷酸(参考核苷酸)为RNA的情况下可以为rUMP<rCMP<rAMP<rGMP。当然,本发明不限定于此。

第三步骤可以是通过将第二步骤中测定的最大电流值与各个核苷酸(以下,称为参考核苷酸)所对应的参考电流值进行比较,作成将由多核苷酸检测到的多个脉冲的各脉冲对应为特定种类的核苷酸的一级碱基序列信息的步骤,也可以是包括该步骤。

即,该第三步骤中,通过将预先测定的参考核苷酸的最大电流值的众数(换言之为参考电流值)与使用多核苷酸实际测定的各脉冲的最大电流值进行比较而将各脉冲与特定种类的核苷酸对应。由此,将第二步骤中测定的最大电流值的信息置换成一级碱基序列信息。

即,该第三步骤中,如果使用多核苷酸实际测定的脉冲的最大电流值与特定的参考核苷酸的最大电流值的众数(换言之为参考电流值)一致,则可以判定发出上述脉冲的多核苷酸中的核苷酸与上述特定的参考核苷酸相同。

上述参考核苷酸是指存在构成多核苷酸的可能性的核苷酸。具体而言,可以是[1-1.第一步骤]栏中作为能够构成多核苷酸的核苷酸而记载的、任意的核糖核苷酸、任意的脱氧核糖核苷酸以及它们的化学修饰物(例如,甲基化、氧代化、羟化、甲酰化、羧化、二聚化、脱碱基化等)。更具体的核苷酸的例子已在[1-1.第一步骤]栏中进行了说明,因此在此省略其说明。

上述参考电流值可以以使参考核苷酸个别地在电极对之间通过时产生的隧穿电流的多个脉冲的最大电流值的众数的形式求出。另外,求参考电流值时使用的电极对优选使用与用于确定核苷酸的碱基序列的电极对相同的电极。如果采用该构成,能够使求参考电流值时的测定条件与确定多核苷酸的碱基序列时的测定条件相同,因此,能够精度良好地确定多核苷酸的碱基序列。

即,本发明中,制作电极对后,先求出关于各种参考核苷酸的参考电流值并且将该参考电流值的数据制成数据库,实际确定多核苷酸的碱基序列时,将来源于多核苷酸的各脉冲的最大电流值与上述制成数据库的参考电流值进行比较,由此确定来源于多核苷酸的各脉冲与哪种参考核苷酸对应即可。

以下,对求参考电流值的方法进行具体说明。

在求参考电流值的情况下,使参考核苷酸个别地、多次在电极对之间通过,对各参考核苷酸测定多个隧穿电流,求出该多个隧穿电流值的最大电流值,将出现频率最高的最大电流值作为参考电流值即可。

首先,使参考核苷酸个别地溶解在溶液(例如,与溶解多核苷酸的溶液相同的溶液)中。

如果将电极对保持在溶解有参考核苷酸的溶液中并向电极对之间施加电压,则在参考核苷酸通过时,参考核苷酸在电极对之间被捕获。参考核苷酸在电极对之间被捕获的期间(参考核苷酸滞留在电极间的期间),电极对之间产生隧穿电流。捕获在电极对之间的参考核苷酸经过预定的时间时,会主动地从电极对解离。通过参考核苷酸从电极对上解离,产生在电极间的隧穿电流消失。这样,通过参考核苷酸在电极对之间被捕获并从电极对之间解离而产生隧穿电流的脉冲。然后,通过重复该捕获和解离,得到针对各参考核苷酸的多个隧穿电流的数据。

向电极对之间施加电压的方法没有特别限定,例如,将公知的电源装置连接到电极对上,向电极对之间施加电压(例如偏压)即可。施加的电压没有特别限定,使用与确定多核苷酸的碱基序列时相同的电压即可。例如为0.25V~0.75V。

这样,向保持在溶解有参考核苷酸的溶液中的电极对之间施加电压,并对由此在电极对之间产生的隧穿电流的电流值进行预定时间的测定即可。隧穿电流的电流值例如进行50分钟的测定即可。

产生在电极对之间的隧穿电流可以使用公知的电流计来测定。另外,可以使用例如电流放大器暂时将隧穿电流的信号进行放大。通过使用电流放大器,能够将微弱的隧穿电流的值放大,因此,能够高灵敏度地测定隧穿电流。作为电流放大器,可以列举例如市售的可调高速电流放大器(Femto公司制造,目录号:DHPCA-100)。

这样,对在电极对之间流过的隧穿电流进行预定时间的测定,随时间推移判定隧穿电流的电流值是否超过基础水平,由此能够检测隧穿电流的脉冲。具体而言,可以根据上述的判定,确定隧穿电流超过基础水平的时间,并且确定再次恢复到基础水平的时间,检测出这两个时间之间的信号作为起因于参考核苷酸的隧穿电流的脉冲。使用表示测定的隧穿电流的电流值与隧穿电流的测定时间的关系的图(例如曲线图)时,能够通过目视容易地进行这样的判定。

这样检测到的起因于参考核苷酸的脉冲存在多种高度的峰。这些峰是由于电极对之间的参考核苷酸的运动所引起的电极与参考核苷酸的距离的变化而出现的。即,参考核苷酸与电极的距离缩短时,容易产生隧穿电流,因此,隧穿电流的电流值增加。另一方面,参考核苷酸与电极的距离延长时,难以产生隧穿电流,因此,隧穿电流的电流值减小。这样,由于参考核苷酸在电极对之间运动,电极与参考核苷酸的距离发生变化,从而隧穿电流的电流值发生增减,因此,隧穿电流的脉冲出现多个种类的峰。

通过由这样检测到的各脉冲的最高峰的电流值减去基础水平,能够求出各脉冲的最大电流值。然后,对求出的各最大电流值进行统计分析,由此能够计算出众数。

为了求出众数,例如,生成表示最大电流值的值与具有该值的脉冲的数量的关系的直方图。然后,将生成的直方图与既定的函数拟合。然后,求出拟合后的函数的峰值,由此能够计算出众数。

作为用于拟合的函数,可以列举高斯函数或泊松函数,优选为高斯函数。通过使用高斯函数,能够得到能够加快数据处理速度的优点。

用于计算众数的统计分析中使用的标本(脉冲)数没有特别限定,例如为500个~1000个。将该程度的数量用于统计分析时,能够计算出统计学上有意义的众数。这种众数对各核苷酸而言是固有的值,因此,可以将该众数作为用于识别核苷酸的指标使用。

如后述的表1所示,本发明人证实了参考核苷酸dGMP、dAMP、dCMP、dTMP、rGMP、rAMP、rCMP和rUMP的众数分别为87pS、67pS、60pS、39pS、123pS、92pS、64pS和50pS。另外,参考核苷酸甲基胞嘧啶、氧代鸟嘌呤和从核糖核苷酸或脱氧核糖核苷酸上脱去碱基后的物质的众数分别为105pS、98pS、0pS(需要说明的是,这些众数是在0.8nm的电极间距、0.4V的偏压、用于统计分析的标本数为1000个的条件下计算出的)。这样,众数对各参考核苷酸而言是固有的值,因此,可以将该众数作为用于识别构成多核苷酸的核苷酸的指标使用。

在此,由于隧穿电流受到电极间的距离、溶液中的核苷酸或多核苷酸的浓度、电极的形状、电极间的电压等的影响,因此,由隧穿电流计算出的众数也受到这些因素的影响。例如,即使是相同种类的核苷酸,在电极间施加的电压为0.25V、0.50V和0.75V时,众数也各不相同。

因此,上述的众数具有分布。因此,作为本申请发明中使用的参考电流值,可以使用“1个点的众数”,也可以使用“具有分布的众数”。在使用“具有分布的众数”作为参考电流值的情况下,该“具有分布的众数”可以表示为用于求出众数的函数(高斯函数或泊松函数)的半峰全宽。

即,作为本发明中使用的参考电流值,可以为参考核苷酸的众数,在将参考核苷酸的众数设为x、将用于计算该参考核苷酸的众数的函数的半峰半宽设为y的情况下,也可以为x±y的范围的值。另外,众数如上所述受到各种条件的影响,因此,参考核苷酸的众数优选为通过与确定多核苷酸的碱基序列时相同的条件而确定的众数。

如后述的表1所示,在参考核苷酸为dGMP的情况下,x为87pS,y为22pS。在参考核苷酸为dAMP的情况下,x为67pS,y为17pS。在参考核苷酸为dCMP的情况下,x为60pS,y为22pS。参考核苷酸为dTMP的情况下,x为39pS,y为11pS。在参考核苷酸为rGMP的情况下,x为123pS,y为54pS。在参考核苷酸为rAMP的情况下,x为92pS,y为33pS。在参考核苷酸为rCMP的情况下,x为64pS,y为18pS。在参考核苷酸为rUMP的情况下,x为50pS,y为12pS。

将第二步骤中测定的各脉冲的最大电流值与上述的参考电流值进行比较,如果最大电流值包含在87±22pS的范围内,则可以判定该脉冲为来源于dGMP的脉冲,如果最大电流值不包含在87±22pS的范围内,则可以判定该脉冲不是来源于dGMP的脉冲。

将第二步骤中测定的各脉冲的最大电流值与上述的参考电流值进行比较,如果最大电流值包含在67±17pS的范围内,则可以判定该脉冲为来源于dAMP的脉冲,如果最大电流值不包含在67±17pS的范围内,则可以判定该脉冲不是来源于dAMP的脉冲。

将第二步骤中测定的各脉冲的最大电流值与上述的参考电流值进行比较,如果最大电流值包含在60±22pS的范围内,则可以判定该脉冲为来源于dCMP的脉冲,如果最大电流值不包含在60±22pS的范围内,则可以判定该脉冲不是来源于dCMP的脉冲。

将第二步骤中测定的各脉冲的最大电流值与上述的参考电流值进行比较,如果最大电流值包含在39±11pS的范围内,则可以判定该脉冲为来源于dTMP的脉冲,如果最大电流值不包含在39±11pS的范围内,则可以判定该脉冲不是来源于dTMP的脉冲。

将第二步骤中测定的各脉冲的最大电流值与上述的参考电流值进行比较,如果最大电流值包含在123±54pS的范围内,则可以判定该脉冲为来源于rGMP的脉冲,如果最大电流值不包含在123±54pS的范围内,则可以判定该脉冲不是来源于rGMP的脉冲。

将第二步骤中测定的各脉冲的最大电流值与上述的参考电流值进行比较,如果最大电流值包含在92±33pS的范围内,则可以判定该脉冲为来源于rAMP的脉冲,如果最大电流值不包含在92±33pS的范围内,则可以判定该脉冲不是来源于rAMP的脉冲。

将第二步骤中测定的各脉冲的最大电流值与上述的参考电流值进行比较,如果最大电流值包含在64±18pS的范围内,则可以判定该脉冲为来源于rCMP的脉冲,如果最大电流值不包含在64±18pS的范围内,则可以判定该脉冲不是来源于rCMP的脉冲。

将第二步骤中测定的各脉冲的最大电流值与上述的参考电流值进行比较,如果最大电流值包含在50±12pS的范围内,则可以判定该脉冲为来源于rUMP的脉冲,如果最大电流值不包含在50±12pS的范围内,则可以判定该脉冲不是来源于rUMP的脉冲。

另外,在第二步骤中测定的脉冲的最大电流值属于多个参考核苷酸的“具有分布的众数”的情况下,可以将该脉冲判定为来源于更接近“具有分布的众数”的峰的参考核苷酸的脉冲。

作为本发明中使用的参考电流值,可以如上所述使用众数本身,也可以使用将核苷酸中任何一种核苷酸的众数设为“1”时对该众数求出的比值。例如,在将dGMP和rGMP的众数的值设为“1”的情况下,求出其他核苷酸的众数的比值,也可以使用该比值作为参考电流值。

这种情况下,例如,上述的参考核苷酸的众数的比值为dGMP:dAMP:dCMP:dTMP=1±0.25:0.77±0.20:0.69±0.25:0.45±0.12,并且,rGMP:rAMP:rCMP:rTMP=1±0.44:0.75±0.27:0.58±0.16:0.41±0.10。

第三步骤中,通过判定第二步骤中测定的各脉冲的最大电流值属于上述参考电流值中的哪一个来将各脉冲与特定的核苷酸对应起来。然后,基于该对应关系,按照第二步骤中测定的各脉冲被测定的时间顺序,作成将各脉冲对应为特定核苷酸的一级碱基序列信息即可。

例如,在第二步骤中检测到8个脉冲的情况下,依据上述的判定基准,将该脉冲置换成“AGATTCAC”这样的一级碱基序列信息。

[1-4.第四步骤]

第四步骤是从多个脉冲中提取由脉冲持续时间相连续的脉冲构成的脉冲群、并且从上述一级碱基序列信息中提取与上述脉冲群对应的多个二级碱基序列信息的步骤。

本说明书中,“脉冲持续时间相连续的脉冲”是指邻接的脉冲的脉冲持续时间的间隔短的脉冲,换言之,是指连续出现的脉冲。

例如,在任意的脉冲的脉冲持续时间与该脉冲所邻接的脉冲的持续时间之间的时间短于对应于1个核苷酸的脉冲持续时间的情况下,认为这些脉冲为来源于多核苷酸内邻接的核苷酸的脉冲,将其分类于同一个脉冲群。这样,将第二步骤中检测到的多个脉冲分类成多个脉冲群。然后,从一级碱基序列信息中提取与各脉冲群对应的多个二级碱基序列信息。

另外,属于1个脉冲群的脉冲数没有特别限定,例如,可以是2个以上的任意数量。属于1个脉冲群的脉冲数越多,则能够使后述的第五步骤中检索的共有的碱基序列的长度越长,结果,能够提高多核苷酸的碱基序列的确定精度。

例如,考虑确定由N个碱基构成的多核苷酸(例如,DNA或RNA)的碱基序列的情况。在N<100的情况下,属于1个脉冲群的脉冲数优选为N/3个以上,更优选为N/2个,更优选为N个,更优选为N个以上。在N>100的情况下,属于1个脉冲群的脉冲数优选为50个以上,更优选为N/2个,更优选为N个,更优选为N个以上。

属于1个脉冲群的脉冲数为50个以上时,在第五步骤和第六步骤中,能够进行精度好的操作。

更具体而言,属于1个脉冲群的脉冲数优选为3个以上,更优选为4个以上,更优选为5个以上,更优选为6个以上,更优选为7个以上。属于1个脉冲群的脉冲数越多越好。

上述的“对应于1个核苷酸的脉冲持续时间”例如可以通过在测定参考核苷酸的最大电流值的众数时同时求出参考核苷酸的脉冲持续时间来确定。

例如,可以测定各种参考核苷酸的脉冲持续时间,并将这些脉冲持续时间中的任何一个脉冲持续时间(例如,最短的脉冲持续时间)看作上述的“1个核苷酸所对应的脉冲持续时间”。

例如,如实施例所示,dGMP的脉冲持续时间的众数约为0.8ms(需要说明的是,这些众数是在0.8nm的电极间距、0.4V的偏压、用于统计分析的标本数为1000个的条件下计算出的)。因此,如果1个脉冲的脉冲持续时间与该脉冲所邻接的脉冲的持续时间之间的时间短于0.8ms,则可以认为这些脉冲为来源于多核苷酸内邻接的核苷酸的脉冲。

另外,第四步骤中,优选提取与由在1ms以上的时间期间上述脉冲持续时间相连续的脉冲构成的脉冲群所对应的多个二级碱基序列信息。

如上所述,来源于1个核苷酸的脉冲的脉冲持续时间为约0.8ms~约1ms。因此,如果脉冲持续时间连续至少1ms以上的时间,则能够除去隧穿电流测定时的噪声,因此,能够精度更好地确定多核苷酸的碱基序列。

另外,脉冲持续时间连续的总计时间越长越好。例如,优选脉冲持续时间连续至少2ms以上的时间、至少5ms以上的时间、至少10ms以上的时间。采用该构成时,不仅能够除去噪声,而且能够确定更长的多核苷酸的碱基序列。

第四步骤中,优选基于概率统计的方法(例如,基于高斯函数或泊松函数等的概率论)提取二级碱基序列。换言之,第四步骤中,优选利用概率统计的方法提取由能够与测定到的隧穿电流对应的多个候选核苷酸中出现概率最高的核苷酸形成的二级碱基序列信息。

如图2(c)和(d)所示,来源于各核苷酸的隧穿电流存在分布,各分布部分重叠。因此,在测定到特定值的隧穿电流的情况下,存在多个产生该隧穿电流的候选核苷酸。但是,来源于各核苷酸的隧穿电流的分布并不完全一致,因此,在测定到特定值的隧穿电流的情况下,产生该隧穿电流的各候选核苷酸之间的概率(出现概率)不同(例如,参考图2(c)和(d))。

例如,上述的概率统计的方法可以是使测定到的隧穿电流与关于该隧穿电流出现概率最高的碱基分子相对应的方法。

作为一例,考虑碱基分子为“A”、“T”、“G”或“C”的情形。在测定到隧穿电流的情况下,将流过该隧穿电流的物质为“A”的概率设为P(A)、将流过该隧穿电流的物质为“T”的概率设为P(T)、将流过该隧穿电流的物质为“G”的概率设为P(G)、将流过该隧穿电流的物质为“C”概率设为P(C)时,它们之间成立以下的关系式。即,

1=P(A)+P(T)+P(G)+P(C)

这种情况下,将值最高的P(X)(X为A、T、G或C)与隧穿电流对应即可。即,判定隧穿电流来源于碱基分子X即可。

例如,在测定到特定值的隧穿电流的情况下,如果设定P(A)为35%、P(G)为50%,P(C)为10%、P(T)为5%,则可以判定该隧穿电流来源于概率最高的核苷酸“G”。

二级碱基序列信息与由连续的多个脉冲构成的脉冲群相对应,可以说是在大致相同的条件下确定的信息。而且,如果在将连续的多个脉冲相互比较的同时基于概率统计的方法提取二级碱基序列,则能够提取更准确的二级碱基序列。

另外,在基于概率统计的方法提取二级碱基序列的情况下,更优选使用电极间的距离保持恒定的电极对。即,优选上述电极对为测定隧穿电流时电极间的距离不变化的电极对。

例如,优选电极间距离的变化率为1%以下的电极对,更优选电极间距离的变化率为0.1%以下的电极对,更优选电极间距离的变化率为0.01%以下的电极对,更优选电极间距离的变化率为0.001%以下的电极对。

利用现有技术制作的电极对在用肉眼观察的情况下,乍看起来电极间的距离像是保持恒定,但实际上电极间的距离微细地发生变化。而且,电极间的距离发生微细的变化时,隧穿电流的值难以达到恒定。即,来源于相同物质的隧穿电流的值发生变化,多核苷酸的碱基序列的确定精度降低。

即,对于利用现有技术制作的电极对而言,图2(c)和(d)等所示的分布容易变动,因此,难以鉴定核苷酸的种类。

另一方面,如果使用电极间的距离能够保持恒定的电极对,则能够使图2(c)和(d)等所示的分布保持恒定,因此,能够使多核苷酸的碱基序列的确定精度更高。

即,如果使用电极间的距离能够保持恒定的电极对,则能够测定不受测定环境影响的稳定的隧穿电流。结果,能够使多核苷酸的碱基序列的确定精度更高。

隧穿电流随多种参数发生较大变动。例如,随电极间的距离发生较大变动。因此,普通技术人员不认为能够基于隧穿电流来确定多核苷酸的碱基序列。另一方面,如实施例所示,本发明人证实了能够基于隧穿电流来确定多核苷酸的碱基序列。

而且,如果在第四步骤中使用概率统计的方法并且使用电极间的距离能够保持恒定的电极对,则能够使多核苷酸的碱基序列的确定精度更高。

在不采用上述构成的情况下,二级碱基序列的精度容易产生偏差。而且,根据情况有时还会使二级碱基序列的精度降低(例如,大致10%以下)。

另一方面,根据上述构成,能够更稳定地测定隧穿电流,因此,能够提高利用概率统计的方法提取的二级碱基序列信息的精度。即,能够提取更准确的二级碱基序列。结果,能够基于与隧穿电流相关的数据更准确地确定多核苷酸的碱基序列。具体而言,采用上述构成时,能够以大致80%以上的稳定的精度提取二级碱基序列,基于该精度高的二级碱基序列,能够准确地确定多核苷酸的碱基序列。

例如,现有的隧穿电流的测量使用装置构成庞大的扫描隧道电子显微镜(STM)进行,但从原理上来说,STM不容易进行溶液中的隧穿电流测量,难以使电极间的距离保持恒定。另一方面,以利用压电驱动器的反馈方式使通过微细加工制作的金属细线机械断裂而制作的纳米间隙电极、通过微细加工制作的基板上的纳米间隙电极在溶液中容易使电极间保持恒定。

[1-5.第五步骤]

第五步骤是检索在多个二级碱基序列信息中的至少两个二级碱基序列信息之间共有的碱基序列的步骤。即,第五步骤是从作为多核苷酸的全长碱基序列信息的片段化信息的二级碱基序列信息中,检索使二级碱基序列信息彼此相连的部位的步骤。

共有的碱基序列的长度没有特别限定,可以为2个碱基长以上的长度,可以为3个碱基以上的长度,可以为4个碱基以上的长度,可以为5个碱基以上的长度,可以为10个碱基以上的长度。为了精度良好地确定多核苷酸的碱基序列,可以说优选共有的碱基序列的长度尽量长。

第五步骤中检索的共有的碱基序列优选为在尽量多的二级碱基序列信息之间共有的碱基序列。例如,优选为在至少2个二级碱基序列信息之间共有的碱基序列,更优选为在至少5个二级碱基序列信息之间共有的碱基序列,更优选为在至少10个二级碱基序列信息之间共有的碱基序列,更优选为在至少15个二级碱基序列信息之间共有的碱基序列,更优选为在至少20个二级碱基序列信息之间共有的碱基序列。根据上述构成,能够精度更好地确定多核苷酸的碱基序列。

[1-6.第六步骤]

第六步骤是通过上述共有的碱基序列将具有该共有的碱基序列的上述二级碱基序列信息彼此相连的步骤。通过该步骤,能够确定多核苷酸(全长或部分长度)的碱基序列。

例如,第五步骤中,在得到“AGATT”、“GATTC”和“TTCAC”作为具有共有的碱基序列的二级碱基序列信息的情况下,例如通过“GATT”将“AGATT”与“GATTC”相连而得到“AGATTC”。然后,通过“TTC”将该“AGATTC”与“TTCAC”相连而得到“AGATTCAC”。

根据上述构成,能够确定更长的多核苷酸的碱基序列。

第六步骤中,可以提取多个第五步骤中检索到的共有的碱基序列的序列信息作为三级碱基序列信息,并将上述三级碱基序列信息彼此相连。

例如,在第五步骤中得到“AGATT”、“GATTC”和“TTCAC”作为具有共有的碱基序列的二级碱基序列信息的情况下,例如将“AGATT”与“GATTC”中共有的“GATT”和“GATTC”与“TTCAC”中共有的“TTC”作为三级碱基序列信息提取。然后,通过“TT”将“GATT”与“TTC”相连而得到“GATTC”。

根据上述构成,能够精度更好地确定多核苷酸的碱基序列。即,“GATTC”的部分为进行了多次碱基序列确定的部分,因此可以说序列的可靠度非常高。

[2.确定多核苷酸的碱基序列的装置]

[2-1.关于各构成]

本实施方式的确定多核苷酸的碱基序列的装置为用于实施本发明的确定多核苷酸的碱基序列的方法的装置。

参考图5对该装置的构成进行了说明,但图5所示的构成只是一例,本发明不限定于此。另外,对于已经在[1.确定多核苷酸的碱基序列的方法]一栏中说明过的事项,在此省略其说明。

本实施方式的装置100具备电压施加部10、电极对20、测定部30、一级碱基序列信息作成部40、二级碱基序列信息提取部50、共有序列检索部60、序列信息连结部70和数据存储部80。以下,对各构成进行说明。

电压施加部10是用于对电极对20施加电压的构成。

利用电压施加部10施加到电极对20上的电压的大小没有特别限定,例如,可以为0.25V~0.75V。

电压施加部10的具体的构成没有特别限定,可以适当使用公知的电压施加装置。

多核苷酸在利用电压施加部10施加有电压的电极对20之间移动,此时,电极对20之间产生隧穿电流。本发明中,基于该隧穿电流确定多核苷酸的碱基序列。

电极对20的具体的构成已经进行了详细说明,因此,在此省略其说明。

测定部30是用于检测多核苷酸在电极对20之间通过时产生的隧穿电流的多个脉冲、并且针对该多个脉冲的各脉冲测定最大电流值和脉冲持续时间的构成。测定部30的具体的构成没有特别限定,适当使用公知的电流测定装置即可。

利用测定部30测定的信息中,至少与最大电流值相关的信息被送到一级碱基序列信息作成部40。另外,此时,存储在数据存储部80的与参考核苷酸的参考电流值相关的信息也被送到一级碱基序列信息作成部40。

一级碱基序列信息作成部40中,通过将多个脉冲的最大电流值之间的大小顺序与参考电流值之间的大小顺序进行比较,作成将利用测定部30检测到的多个脉冲的各脉冲对应为特定种类的核苷酸的一级碱基序列信息。

一级碱基序列信息作成部40中,也可以通过将利用测定部30检测到的最大电流值的相关信息与存储在数据存储部80的参考电流值的相关信息进行比较,作成将利用测定部30检测到的多个脉冲的各脉冲对应为特定种类的核苷酸的一级碱基序列信息。

一级碱基序列信息作成部40和数据存储部80的具体的构成没有特别限定,可以使用现有公知的计算机等运算装置和存储器。

二级碱基序列信息提取部50接收从测定部30送来的至少与脉冲持续时间相关的信息、从一级碱基序列信息作成部40送来的一级碱基序列信息和从数据存储部80送来的与参考核苷酸的脉冲持续时间相关的信息。然后,二级碱基序列信息提取部50基于这些信息从多个脉冲中提取由脉冲持续时间相连续的脉冲构成的脉冲群,并且从一级碱基序列信息中提取与上述脉冲群对应的多个二级碱基序列信息。

另外,二级碱基序列信息提取部50可以提取与由在1ms以上的时间期间脉冲持续时间相连续的脉冲构成的脉冲群所对应的多个二级碱基序列信息。

二级碱基序列信息提取部50的具体的构成没有特别限定,可以使用现有公知的计算机等运算装置。

共有序列检索部60从二级碱基序列信息提取部50接收多个二级碱基序列信息,并检索在该多个二级碱基序列信息中的至少两个二级碱基序列信息之间共有的碱基序列。

需要说明的是,利用共有序列检索部60检索的共有的碱基序列可以是在至少10个二级碱基序列信息之间共有的碱基序列。

共有序列检索部60的具体的构成没有特别限定,可以使用现有公知的计算机等运算装置。

序列信息连结部70从共有序列检索部60接收与共有的碱基序列相关的信息,并且通过共有的碱基序列将具有共有的碱基序列的上述二级碱基序列信息彼此相连。

另外,序列信息连结部70可以提取多个利用共有序列检索部60检索到的共有的碱基序列的序列信息作为三级碱基序列信息,并将三级碱基序列信息彼此相连。

利用序列信息连结部70相连后的数据成为检测结果。

序列信息连结部70的具体的构成没有特别限定,可以使用现有公知的计算机等运算装置。

[2-2.装置100的动作流程的一例]

图6中示出装置100的动作流程的一例。另外,该流程仅为一例,本发明不限定于此。

S101中,向电极对20之间填充含有多核苷酸的溶液。

S102中,利用电压施加部10对电极对20施加电压。由此,通过存在于电极对20之间的多核苷酸流过隧穿电流。

S103中,利用测定部30检测隧穿电流的多个脉冲,并且针对该多个脉冲的各脉冲测定最大电流值和脉冲持续时间。

S104中,基于上述最大电流值等利用一级碱基序列信息作成部40作成一级碱基序列信息。

S105中,利用二级碱基序列信息提取部50进行多个二级碱基序列信息的提取。此时,在未能提取到多个二级碱基序列信息的情况下,返回S102。此时,在能够提取到多个二级碱基序列信息的情况下,进入S106。

S106中,利用共有序列检索部60进行多个二级碱基序列信息中共有的碱基序列的检索。此时,在未能检索到多个二级碱基序列信息中共有的碱基序列的情况下,返回S102。此时,在能够检索到多个二级碱基序列信息中共有的碱基序列的情况下,进入S107。

S107中,利用序列信息连结部70将碱基序列信息连结。

上述实施方式的装置100、装置100中具备的各构成和各步骤可以通过使CPU等运算单元执行存储在ROM(Read Only Memory,只读存储器)、RAM等存储单元中的程序,操控键盘等输入单元、显示器等输出单元或接口电路等通信单元来实现。

因此,仅通过具有这些单元的计算机读取记录有上述程序的记录介质并执行该程序就能够实现上述实施方式的装置100、装置100中具备的各构成和各步骤。另外,通过将上述程序记录在可移动的记录介质上,能够在任意的计算机上实现上述的各种功能和各种处理。

作为上述记录介质,可以是用于使用微型计算机进行处理的未图示的存储器、例如ROM这样的存储器为程序介质,另外,虽然没有图示,也可以是设置程序读取装置作为外部存储装置、通过将记录介质插入其中而能够进行读取的程序介质。

另外,在任何一种情况下,均优选为所存储的程序通过微处理器读取来执行的构成。更优选为读出程序、将读出的程序下载到微型计算机的程序存储区并执行该程序的方式。需要说明的是,优选该下载用的程序预先存储在主体装置中。

另外,上述程序介质为以能够与主体分离的方式构成的记录介质,可以有包括磁带、盒式磁带等磁带类、软盘、硬盘等磁盘或CD/MO/MD/DVD等盘的磁盘类、IC卡(包括存储卡)等卡类,或者利用掩模ROM、EPROM(Erasable Programmable Read Only Memory,可擦可编程只读存储器)、EEPROM(注册商标)(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、闪速ROM等的半导体存储器的、固定地负载程序的记录介质等。

另外,如果是能够连接包括互联网在内的通信网络的系统构成,则优选为以从通信网络下载程序的方式流动地负载程序的记录介质。

此外,在这样从通信网络下载程序的情况下,优选该下载用程序预先存储在主体装置中或者从另一记录介质上进行安装。

本发明也可以以下述方式构成。

为了解决上述问题,本发明的确定多核苷酸的碱基序列的方法的特征在于,具有:第一步骤,使上述多核苷酸在电极对之间通过;第二步骤,检测上述多核苷酸在上述电极对之间通过时产生的隧穿电流的多个脉冲、并且针对该多个脉冲的各脉冲测定最大电流值和脉冲持续时间;第三步骤,通过将上述多个脉冲的最大电流值之间的大小顺序、和与起因于各个核苷酸与形成上述电极对的金属的能级差的电子状态相对应的参考电流值之间的大小顺序进行比较,作成将上述多个脉冲的各脉冲对应为特定种类的核苷酸的一级碱基序列信息;第四步骤,从上述多个脉冲中提取由上述脉冲持续时间相连续的脉冲构成的脉冲群、并且从上述一级碱基序列信息中提取与上述脉冲群对应的多个二级碱基序列信息;第五步骤,检索在上述多个二级碱基序列信息中的至少两个二级碱基序列信息之间共有的碱基序列;和第六步骤,通过上述共有的碱基序列将具有上述共有的碱基序列的上述二级碱基序列信息彼此相连。

根据上述构成,能够基于与隧穿电流相关的数据确定多核苷酸的碱基序列。

本发明的确定多核苷酸的碱基序列的方法优选在上述第三步骤中,通过进一步将上述最大电流值与各个核苷酸所对应的参考电流值进行比较,作成将上述多个脉冲的各脉冲对应为特定种类的核苷酸的一级碱基序列信息。

根据上述构成,能够基于与隧穿电流相关的数据确定多核苷酸的碱基序列

本发明的确定多核苷酸的碱基序列的方法中,优选上述参考电流值是使核苷酸个别地在上述电极对之间通过时产生的隧穿电流的多个脉冲的最大电流值中的众数。

根据上述构成,能够优化参考电流值的值,因此,能够精度更好地确定多核苷酸的碱基序列。

本发明的确定多核苷酸的碱基序列的装置中,上述电极对为金电极,上述参考电流值的大小顺序在上述核苷酸为DNA的情况下可以为dTMP<dCMP<dAMP<甲基dAMP<dGMP<氧代dGMP<甲基dCMP,在上述核苷酸为RNA的情况下可以为rUMP<rCMP<rAMP<rGMP。

根据上述构成,能够基于与隧穿电流相关的数据确定多核苷酸的碱基序列。

本发明的确定多核苷酸的碱基序列的方法优选在上述第六步骤中,提取多个上述第五步骤中检索到的共有的碱基序列的序列信息作为三级碱基序列信息,并将该三级碱基序列信息彼此相连。

根据上述构成,仅使用可靠性更高的三级碱基序列信息确定碱基序列,因此,能够精度更好地确定多核苷酸的碱基序列。

本发明的确定多核苷酸的碱基序列的方法中,优选上述第五步骤中检索到的上述共有的碱基序列是在至少10个二级碱基序列信息之间共有的碱基序列。

根据上述构成,使用可靠性更高的共有的碱基序列确定碱基序列,因此,能够精度更好地确定多核苷酸的碱基序列。

本发明的确定多核苷酸的碱基序列的方法优选在上述第四步骤中,提取与由在1ms以上的时间期间上述脉冲持续时间相连续的脉冲构成的脉冲群对应的多个二级碱基序列信息。

根据上述构成,能够除去噪声并且能够得到长的二级碱基序列信息,因此,能够更高效地确定多核苷酸的碱基序列。

本发明的确定多核苷酸的碱基序列的方法中,优选上述电极对为电极间的距离保持恒定的电极对,上述第四步骤中,通过概率统计的方法提取上述二级碱基序列信息。

在不采用上述构成的情况下,二级碱基序列的精度容易产生偏差。而且,根据情况有时还会使二级碱基序列的精度降低(例如,大致10%以下)。

另一方面,根据上述构成,能够更稳定地测定隧穿电流,因此,能够提高利用概率统计的方法提取的二级碱基序列信息的精度。即,能够提取更准确的二级碱基序列。结果,能够基于与隧穿电流相关的数据更准确地确定多核苷酸的碱基序列。具体而言,采用上述构成时,能够以大致80%以上的稳定的精度提取二级碱基序列,基于该精度高的二级碱基序列,能够准确地确定多核苷酸的碱基序列。

为了解决上述问题,本发明的确定多核苷酸的碱基序列的装置的特征在于,具备:具有能够使多核苷酸通过的电极间距的电极对;检测上述多核苷酸在上述电极对之间通过时产生的隧穿电流的多个脉冲、并且针对该多个脉冲的各脉冲测定最大电流值和脉冲持续时间的测定部;通过将上述多个脉冲的最大电流值之间的大小顺序、和与起因于各个核苷酸与形成上述电极对的金属的能级差的电子状态相对应的参考电流值之间的大小顺序进行比较,作成将上述多个脉冲的各脉冲对应成特定种类的核苷酸的一级碱基序列信息的一级碱基序列信息作成部;从上述多个脉冲中提取由上述脉冲持续时间相连续的脉冲构成的脉冲群、并且从上述一级碱基序列信息中提取与上述脉冲群对应的多个二级碱基序列信息的二级碱基序列信息提取部;检索在上述多个二级碱基序列信息中的至少两个二级碱基序列信息之间共有的碱基序列的共有序列检索部;和通过上述共有的碱基序列将具有上述共有的碱基序列的上述二级碱基序列信息彼此相连的序列信息连结部。

根据上述构成,能够基于与隧穿电流相关的数据确定多核苷酸的碱基序列。

本发明的确定多核苷酸的碱基序列的装置中,优选上述一级碱基序列信息作成部通过进一步将上述最大电流值与各个核苷酸所对应的参考电流值进行比较,作成将上述多个脉冲的各脉冲对应成特定种类的核苷酸的一级碱基序列信息。

根据上述构成,能够基于与隧穿电流相关的数据确定多核苷酸的碱基序列。

本发明的确定多核苷酸的碱基序列的装置中,优选上述参考电流值是使核苷酸个别地在上述电极对之间通过时产生的隧穿电流的多个脉冲的最大电流值中的众数。

根据上述构成,能够优化参考电流值的值,因此,能够精度更好地确定多核苷酸的碱基序列。

本发明的确定多核苷酸的碱基序列的装置中,上述电极对为金电极,上述参考电流值的大小顺序在上述核苷酸为DNA的情况下可以为dTMP<dCMP<dAMP<甲基dAMP<dGMP<氧代dGMP<甲基dCMP,在上述核苷酸为RNA的情况下可以为rUMP<rCMP<rAMP<rGMP。

根据上述构成,能够基于与隧穿电流相关的数据确定多核苷酸的碱基序列。

本发明的确定多核苷酸的碱基序列的装置中,优选上述序列信息连结部提取多个由上述共有序列检索部检索到的共有的碱基序列的序列信息作为三级碱基序列信息,并将该三级碱基序列信息彼此相连。

根据上述构成,仅使用可靠性更高的三级碱基序列信息确定碱基序列,因此,能够精度更好地确定多核苷酸的碱基序列。

本发明的确定多核苷酸的碱基序列的装置中,优选由上述共有序列检索部检索到的上述共有的碱基序列是在至少10个二级碱基序列信息之间共有的碱基序列。

根据上述构成,使用可靠性更高的共有的碱基序列确定碱基序列,因此,能够精度更好地确定多核苷酸的碱基序列。

本发明的确定多核苷酸的碱基序列的装置中,优选上述二级碱基序列信息提取部提取与由在1ms以上的时间期间上述脉冲持续时间相连续的脉冲构成的脉冲群对应的多个二级碱基序列信息。

根据上述构成,能够除去噪声并且能够得到长的二级碱基序列信息,因此,能够更高效地确定多核苷酸的碱基序列。

本发明的确定多核苷酸的碱基序列的装置中,优选上述电极为电极间的距离保持恒定的电极对,上述二级碱基序列信息提取部通过概率统计的方法提取上述二级碱基序列信息。

在不采用上述构成的情况下,二级碱基序列的精度容易产生偏差。而且,根据情况有时还会使二级碱基序列的精度降低(例如,大致10%以下)。

另一方面,根据上述构成,能够更稳定地测定隧穿电流,因此,能够提高利用概率统计的方法提取的二级碱基序列信息的精度。即,能够提取更准确的二级碱基序列。结果,能够基于与隧穿电流相关的数据更准确地确定多核苷酸的碱基序列。具体而言,采用上述构成时,能够以大致80%以上的稳定的精度提取二级碱基序列,基于该精度高的二级碱基序列,能够准确地确定多核苷酸的碱基序列。

本发明可以以如下方式构成。当然,可以将以下的构成与本说明书中记载的所有构成进行组合。

为了解决上述问题,本发明的确定多核苷酸的碱基序列的方法的特征在于,具有:第一步骤,使上述多核苷酸在电极对之间通过;第二步骤,检测上述多核苷酸在上述电极对之间通过时产生的隧穿电流的多个脉冲、并且针对该多个脉冲的各脉冲测定最大电流值和脉冲持续时间;第三步骤,通过将上述最大电流值和与各个核苷酸相对应的参考电流值进行比较,作成将上述多个脉冲的各脉冲对应为特定种类的核苷酸的一级碱基序列信息;第四步骤,从上述多个脉冲中提取由上述脉冲持续时间相连续的脉冲构成的脉冲群、并且从上述一级碱基序列信息中提取与上述脉冲群对应的多个二级碱基序列信息;第五步骤,检索在上述多个二级碱基序列信息中的至少两个二级碱基序列信息之间共有的碱基序列;和第六步骤,通过上述共有的碱基序列将具有上述共有的碱基序列的上述二级碱基序列信息彼此相连。

根据上述构成,能够基于与隧穿电流相关的数据确定多核苷酸的碱基序列。

为了解决上述问题,本发明的确定多核苷酸的碱基序列的装置的特征在于,具有能够使多核苷酸通过的电极间距的电极对;检测上述多核苷酸在上述电极对之间通过时产生的隧穿电流的多个脉冲、并且针对该多个脉冲的各脉冲测定最大电流值和脉冲持续时间的测定部;通过将上述最大电流值和与各个核苷酸相对应的参考电流值进行比较,作成将上述多个脉冲的各脉冲对应为特定种类的核苷酸的一级碱基序列信息的一级碱基序列信息作成部;从上述多个脉冲中提取由上述脉冲持续时间相连续的脉冲构成的脉冲群、并且从上述一级碱基序列信息中提取与上述脉冲群对应的多个二级碱基序列信息的二级碱基序列信息提取部;检索在上述多个二级碱基序列信息中的至少两个二级碱基序列信息之间共有的碱基序列的共有序列检索部;和通过上述共有的碱基序列将具有上述共有的碱基序列的上述二级碱基序列信息彼此相连的序列信息连结部。

根据上述构成,能够基于与隧穿电流相关的数据确定多核苷酸的碱基序列。

实施例

<1.电极对的制作>

使用纳米加工机械可控断结法(MCBJ)形成图1所示的电极对(参考Tsutsui,M.,Shoji,K.,Taniguchi,M.Kawai,T.,Formation andself-breaking mechanism of stable atom-sized junctions.Nano Lett.8,345-349(2007))。以下,简单地说明电极对的制作方法。

使用电子束光刻装置(日本电子公司制造,目录号:JSM6500F),通过标准的电子束光刻法和剥离技术在由聚酰亚胺(Industrial SummitTechnology公司制造,目录号:Pyre-Ml)包覆的挠性的金属基板(磷青铜基板)上图案成形纳米级金接头。

接着,使用反应性离子蚀刻装置(サムコ公司制造,目录号:10NR),通过基于反应性离子蚀刻法的蚀刻将位于该接头的下方的聚酰亚胺除去。然后,将基板弯曲,由此制作利用3点弯曲的结构的纳米级金桥。需要说明的是,这样的基板的弯曲使用压电驱动器(CEDRAT公司制造,目录号:APA150M)进行。

然后,对上述桥进行拉伸,使桥的一部分断裂,由此形成电极对(金电极)。具体而言,使用数据采集板(美国国家仪器公司制造,目录号:NI PCIe-6321),通过电阻反馈法在程控的接头的拉伸速度下,使用10kΩ的串联电阻对该桥施加0.1V的DC偏压(Vb),对桥进行拉伸,使桥断裂。然后,进一步拉伸桥,将因断裂而产生的间隙的大小(电极间距)设定为目标核苷酸分子的长度(约1nm)。

通过这样的步骤,得到电极对。需要说明的是,对制作的电极对进行显微镜观察,电极对的电极间的距离为0.80nm。

<2.电极对之间产生的隧穿电流的测定>

将电极对浸入溶解有核苷酸或多核苷酸的Milli-Q水中,测定核苷酸或多核苷酸在电极对之间被捕获时产生的隧穿电流。另外,Milli-Q水中的核苷酸或多核苷酸的浓度均为0.10μM。

使用对数放大器(根据Rev.Sci.Instrum.68(10),3816中记载的设计,由株式会社大和技研制作)和PXI 4071数字万用表(美国国家仪器),在0.4V的DC偏压下以10kHz测定在具有0.80nm的长度的电极间距的电极对之间流过的隧穿电流。对于各样品,进行测定直至检测到200个或1000个脉冲,对这些脉冲进行分析。

<3.参考核苷酸的最大电流值和脉冲持续时间的测定>

使4种单磷酸脱氧核糖核苷(dAMP(2’-脱氧腺苷-5’-单磷酸;Sigma-Aldrich)、dCMP(2’-脱氧胞苷-5’-单磷酸钠盐;Sigma-Aldrich)、dGMP(2’-脱氧鸟苷-5’-单磷酸钠盐水合物;Sigma-Aldrich)、dTMP(胸苷酸二钠盐;东京化学工业公司(TCI)))和4种单磷酸核糖核苷(rAMP(2’-腺苷-5’-单磷酸二钠盐;Oriental yeast)、rCMP(胞苷5’-单磷酸二钠盐;TCI)、rGMP(鸟苷5’-单磷酸钠盐水合物;TCI)、rUMP(尿苷5’-单磷酸二钠盐水合物;TCI))各自个别地通过上述电极对之间,测定此时电极对之间产生的隧穿电流,并且测定该隧穿电流的脉冲的最大电流值和脉冲持续时间。另外,作为其他试样,对甲基胞嘧啶、甲基腺嘌呤、氧代鸟嘌呤也进行了测定。

具体而言,以使终浓度为0.10μM的方式向Milli-Q水中分别添加上述单磷酸脱氧核糖核苷酸或单磷酸核糖核苷酸,制作测定用溶液。

在将该测定用溶液填充到电极之间的空间的状态下对纳米间隙电极间施加0.4V的电压,测定此时电极间产生的隧穿电流。另外,此时,存在于电极之间的单磷酸脱氧核糖核苷或单磷酸核糖核苷进行布朗运动(测定用溶液的温度为约25℃)。

图2(a)中示出了使用含有dGMP的测定用溶液时随时间经过而测定的隧穿电流的数据。如图2(a)所示,随着时间的经过,观察到多个隧穿电流的脉冲。另外,隧穿电流的大小为约10pA~约100pA。

图2(b)中例示了图2(a)所示的多个隧穿电流的脉冲中的1个脉冲。如图2(b)所示,各脉冲可以由Ip(最大电流值)和td(脉冲持续时间)规定。例如,dGMP的典型的Ip和td为Ip=100pA,td=1ms。

对各单磷酸脱氧核糖核苷和各单磷酸核糖核苷,使用约1000个脉冲制作电导(Ip/V)直方图。需要说明的是,该电导(Ip/V)直方图的作成使用高斯分布。

图2(c)和图2(d)中示出了电导(Ip/V)直方图。如图2(c)和图2(d)所示,各核酸单体的G值(G值=电导(Ip/V)直方图的峰值)是dGMP为87pS、dAMP为67pS、dCMP为60pS、dTMP为39pS、rGMP为123pS、rAMP为92pS、rCMP为64pS、rUMP为50pS。如果比较该数值的大小,对于DNA而言为dGMP(87pS)>dAMP(67pS)>dCMP(60pS)>dTMP(39pS),对于RNA而言为rGMP(123pS)>rAMP(92pS)>rCMP(64pS)>rUMP(50pS)。

将上述G值相对于dGMP或rGMP标准化后得到的值示于下述表1中。

表1

核酸单体的种类G值(pS)相对的G值±FWHMdGMP871.00±0.25dAMP670.77±0.20dCMP600.69±0.25dTMP390.45±0.12rGMP1231.00±0.44rAMP920.75±0.27rCMP640.58±0.16rUMP500.41±0.10

FWHM:半峰全宽

根据基于密度泛函理论的计算,最高己占分子轨道能量(HOMO)是鸟嘌呤为-5.7eV、腺嘌呤为-5.9eV、胞嘧啶为-6.1eV、胸腺嘧啶为-6.6eV、尿嘧啶为-6.9eV。如果比较该数值的大小,则为鸟嘌呤(-5.7eV)>腺嘌呤(-5.9eV)>胞嘧啶(-6.1eV)>胸腺嘧啶(-6.6eV)>尿嘧啶(-6.9eV)。

分子轨道能量的大小顺序与上述相对的G值的大小顺序相同。这表明,基于隧穿电流确定核酸单体的种类的方法能够基于能级(特别是HOMO能级)确定分子的种类。

另外表明,使用上述的“相对的G值±FWHM”时,能够确定核酸单体的种类。

另外,虽然未在上述表1中示出,甲基胞嘧啶和氧代鸟嘌呤各自的G值为105pS、98pS。

另外,将在同样的实验条件下测定的另一试验结果示于表2中。

表1的试验结果和表2的试验结果显示出同样的倾向。

表2

核酸单体的种类G值(pS)相对的G值±FWHM氧代-dGMP81.41.13±0.31甲基dCMP87.21.21±0.27dGMP72.11.00±0.25甲基dAMP63.30.88±0.21dAMP51.90.77±0.20dCMP49.70.69±0.25dTMP32.40.45±0.12

FWHM:半峰全宽

<4.DNA寡聚物的核酸序列的确定>

在上述的<3.参考核苷酸的最大电流值和脉冲持续时间的测定>的试验中,使用DNA寡聚物(具体而言为TGT、GTG、ATA、CAC或GAG)代替核酸单体进行同样的试验。

如图3(b)~图3(f)所示,对于TGT、GTG、ATA、CAC和GAG,各自观察到2种电导水平。

对于TGT、GTG和GAG(各自与图3(b)、(c)、(f)对应)而言,在认为较高的相对的G值与dGMP(=1)对应的情况下,较低的相对的G值分别为“0.29±0.12”、“0.35±0.12”和“0.68±0.12”(参考下述表3)。

这些值落入了参考核苷酸中的dTMP的“相对的G值±FWHM”(0.45±0.12)和参考核苷酸中的dAMP的“相对的G值±FWHM”(0.77±0.20)的范围内,因此,0.29±012、0.35±0.12和0.68±0.12这样的所得值分别与dTMP、dTMP和dAMP对应。

同样地,对于ATA和CAC(各自与图3(d)、(e)对应)而言,在认为较高的相对的G值与dAMP(=0.77)对应的情况下,较低的G值分别为“0.41±0.07”和“0.52±0.12”(参考下述表3)。

这些值落入了参考核苷酸中的dTMP的“相对的G值±FWHM”(0.45±0.12)和参考核苷酸中的dCMP的“相对的G值±FWHM”(0.69±0.25)的范围内,因此,0.41和0.52这样的所得值分别与dTMP和dCMP对应。

由以上的结果表明,基于参考核苷酸的“相对的G值±FWHM”能够确定构成DNA寡聚物的核苷酸的种类。

表3

<5.脉冲持续时间的分析>

关于dGMP和DNA寡聚物(具体而言为GGG),对隧穿电流的脉冲(约1000个脉冲)进行td(脉冲持续时间)的测定,并且观察该td的分布。

图3(a)中示出了随时间经过出现的DNA寡聚物的隧穿电流的脉冲。如图3(a)所示,DNA寡聚物与dGMP同样地出现了具有大致相同水平的相对的G值的脉冲群。

图2(e)中示出了DNA寡聚物的td的分布和dGMP的td的分布。由图2(e)表明,DNA寡聚物的td的峰值约为0.8ms,dGMP的td的峰值也约为0.8ms。

由此可以认为,具有约0.8ms~约1ms以上的td的隧穿电流的脉冲与实际的核苷酸对应。即,可以认为具有比该值更短的td的隧穿电流的脉冲为噪声等。

例如,与G或T对应的隧穿电流的脉冲为具有1个平台状峰的脉冲,与GT或TG对应的隧穿电流的脉冲为具有2个平台状峰的脉冲,与TGT或GTG对应的隧穿电流的脉冲为具有3个平台状峰的脉冲。即,如果要确定由3个核酸单体构成的DNA寡聚物的电子信号,则确定td的合计为1ms以上且具有3个平台状峰、并且各脉冲的td相连续的脉冲群即可。

图3(d)~图3(f)中各自示出了自动提取电信号的结果。在这些图中,观察到具有3个平台状峰的明确的脉冲。

例如,在示出与DNA寡聚物TGT相关的数据的图3(g)中,检测到在第1号的位置和第3号的位置具有表示T的较低的平台状峰、并且在第2号的位置具有表示G的较高的平台状峰的脉冲。

另外,在示出与DNA寡聚物GTG相关的数据的图3(h)中,检测到在第1号的位置和第3号的位置具有表示G的较高的平台状峰、并且在第2号的位置具有表示T的较低的平台状峰的脉冲。

即,这些数据表明本发明能够确定DNA寡聚物的碱基序列。

如图3(g)和图3(h)所示,在该实施例中,不仅确定了“GTG”和“TGT”,而且还确定了“G”、“T”、“TG”、“GT”、“GTGTT”和“TGTGT”等序列。认为这是由于DNA寡聚物在进行布朗运动的同时随机地在纳米间隙电极之间被捕获。例如,在纳米间隙电极之间,在由布朗运动引起的该TGT寡聚物的运动的方向在TGT寡聚物的第3号的T的位置发生逆转的情况下,检测到与“TGTGT”对应的隧穿电流的脉冲。

<6.多核苷酸的碱基序列的确定>

在上述的<5.脉冲持续时间的分析>的试验中,使用“5’-UGAGGUA-3’”(以下,也称为miRNA)代替DNA寡聚物进行同样的试验。

首先,为了得到随机片段化的序列信息,先作成I-t曲线。

如图4(a)所示,由I-t曲线作成的电导直方图中,在I=70pS、I=50pS、1=33pS处显示3个峰。

这3个峰的相对的G值分别为1、0.71和0.47,这些值分别与rGMP、rAMP和rUMP对应(参考表4)

表4

参考值图4(b)图4(c)图4(d)rGMP1.00±0.441.00±0.161.00±0.131.00±0.13rAMP0.75±0.270.65±0.150.55±0.160.73±0.16rUMP0.41±0.100.33±0.070.29±0.110.36±0.09

上述结果表明miRNA中含有3种核酸单体。

与上述的<5.脉冲持续时间的分析>同样地确定miRNA的部分碱基序列。

图4(b)~图4(d)中示出了检测到的典型的信号。如图4(b)~图4(d)所示,能够确定“A”、“G”、“U”、“AU”、“UGAGG”和“UGAGGUA”等部分碱基序列。

同样地对133个信号进行分析,结果,19个信号与“A”对应,15个信号与“G”对应,44个信号与“U”对应,5个信号与“UA”对应,10个信号与“GA”对应,5个信号与“UG”对应,35个信号与图4(e)所示的序列对应。

如图4(e)所示,还得到了“GAGAGGUA”、“UGAGGAGA”和“UGAGGUAUA”这样的序列信息。认为这些是布朗运动的结果产生的序列信息。

另外,如图4(e)所示,有时miRNA中的“AGGUA”和“GAGGUA”可能分别被误确定为“AGAUA”和“GAGGUG”。认为这是由于rGMP的相对的G值与rAMP的相对的G值重叠而产生的。

接着,如图4(e)所示,将35个所得到的部分碱基序列的重复部分相连,由此确定miRNA的全部碱基序列。具体而言,提取出现频率高的部分碱基序列,并将该部分碱基序列相连,由此确定miRNA的全部碱基序列。

具体而言,如图4(e)所示,在35个部分碱基序列中的13个部分碱基序列中(13/35=37%)发现了与“UGA”对应的部分碱基序列,在35个部分碱基序列中的17个部分碱基序列中(17/35=49%)发现了与“GAGG”对应的部分碱基序列,在35个部分碱基序列中的10个部分碱基序列中(10/35=29%)发现了与“AGGUA”对应的部分碱基序列,在35个部分碱基序列中的13个部分碱基序列中(13/35=37%)发现了与“AGGU”对应的部分碱基序列。

然后,将“UGA”、“GAGG”、“AGGUA”和“AGGU”在重复的碱基序列的位置处相连,由此成功地确定了“UGAGGUA”这样的全部碱基序列。

本发明并不限定于以上说明的各构成,可以在权利要求书所示的范围内进行各种变更,通过将不同的实施方式、实施例中各自公开的技术手段适当组合而得到的实施方式、实施例也包含在本发明的技术范围内。

产业上的可利用性

本发明能够用于通过测定由1分子的多核苷酸产生的隧穿电流来进行多核苷酸的碱基序列的确定的装置。另外,本发明能够用于检测序列已知的多核苷酸中产生的突变(例如单碱基置换等)的装置(突变检测装置)。

本发明为美国国立卫生研究院(NIH)推行的更先进的下一代测序仪的基本原理,能够应用于不需要利用PCR的DNA的扩增和DNA的化学修饰的更先进的下一代测序仪。另外,本发明能够应用于以1个分子检测流感病毒、过敏原等生物分子的高灵敏度传感器。

标号说明

10 电压施加部

20 电极对

30 测定部

40 一级碱基序列信息作成部

50 二级碱基序列信息提取部

60 共有序列检索部

70 序列信息连结部

80 数据存储部

100 装置

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号