法律状态公告日
法律状态信息
法律状态
2016-04-20
授权
授权
2014-07-30
实质审查的生效 IPC(主分类):G01N21/65 申请日:20140310
实质审查的生效
2014-07-02
公开
公开
技术领域
本发明涉及细胞光学测量领域,具体是指多元线性回归拟合获得真实的细胞 拉曼光谱的方法。
背景技术
拉曼光谱能够定量分析细胞的组成和组成结构,提供了大量关于组成细胞的 蛋白质、核酸、脂质、糖原等大量生物大分子的信息,而且可以在不损伤细胞的 条件下实时动态监控细胞分子结构变化。然后,在进行细胞拉曼光谱测量时,背 景噪声特别是荧光背景噪声非常大。如何有效消除荧光背声,一直是拉曼光谱应 用研究中需要解决的难点问题之一。目前消除细胞拉曼荧光背景的方法包括:最 小二乘法算法、多项式拟合算法和非对称的最小二乘法算法。上述方法利用细胞 拉曼光谱的强度分布轮廓,结合光谱特征进行其荧光背景拟合,经过验证,利用 上述方法得到的细胞拉曼光谱差别比较大,说明目前的荧光背景估算方法存在较 大误差。
发明内容
本发明的目的是提供多元线性回归拟合获得真实的细胞拉曼光谱的方法,该 方法操作简单,并且能够得到真实的细胞拉曼光谱。
本发明的上述目的通过如下技术方案来实现的:多元线性回归拟合获得真实 的细胞拉曼光谱的方法,包括如下步骤:
(1)获取细胞的原始拉曼光谱;
(2)对原始拉曼光谱进行消除高频窄带噪声的平滑处理,得到平滑后的平滑 拉曼光谱;
(3)获取细胞中各个基元变量的基元变量拉曼光谱;
(4)利用荧光背景计算方法进行估算,得到细胞的近似荧光背景拉曼光谱, 作为背景变量;
(5)利用线性叠加的方法,对基元变量拉曼光谱和背景变量拉曼光谱进行线 性叠加拟合平滑拉曼光谱,获得每个基元变量以及背景变量对应的拟合系数;
(6)对所有背景变量拉曼光谱进行加权叠加,得到细胞的荧光背景拉曼光谱, 其中,权重系数为各个背景变量拉曼光谱对应的拟合系数;
(7)用平滑拉曼光谱减去步骤(6)得到的荧光背景拉曼光谱,得到真实的细胞 拉曼光谱。
本发明用于消除细胞拉曼光谱的背景荧光,能够比其他方法更加精确地拟合 出细胞拉曼光谱的荧光背景,实现细胞拉曼光谱荧光背景的快速消除,从而获得 真实的细胞拉曼光谱。
本发明中,所述细胞的基元变量包括肌动蛋白、白蛋白、三油酸甘油酯、磷 脂酰胆碱、DNA、RNA和糖原。
本发明中,所述步骤(2)中对原始拉曼光谱进行消除高频窄带噪声的平滑处 理所使用的方法是Savitzky-golay平滑处理法,Savitzky-golay平滑就是卷积平滑。
本发明中,所述步骤(4)中荧光背景计算方法采用最小二乘算法和多项式拟 合算法。
本发明综合了组成细胞基本生化成分的拉曼光谱和现有细胞拉曼光谱荧光 背景拟合算法,对现有荧光背景算法估算出的近似荧光背景进行评估的基础上, 提出采用多元线性回归拟合的算法,拟合得到更加准确的细胞拉曼光谱荧光背 景,而且本发明能够再做一些扩展,对拉曼光谱的应用和应用研究有一定的指导 作用。
本发明所述的方法是一种包容性的方法,它提供了一个平台,让不同的荧光 拉曼背景的计算方法都能参与其中,最后通过多元线性叠加方法对这些荧光背景 的获取方法做一个拟合,也就是说,所有荧光背景计算方法所计算的荧光背景再 加权叠加得到更加精确合理的真实细胞拉曼光谱的荧光背景。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细说明。
附图1为本发明的流程框图;
附图2为细胞的原始拉曼光谱;
附图3为经过Savitzky-golay平滑后的平滑拉曼光谱;
附图4为细胞七种基元变量的基元变量拉曼光谱;
附图5为分别用自适应最小迭代二乘算法、五项式拟合算法和四项式拟合算 法估算出3种近似荧光背景拉曼光谱;
附图6为多元线性回归方法拟合出的10个变量,包括7个基元变量和3个 荧光背景变量;
附图7为利用图6中的10个变量对图3进行多元线性回归拟合结果;
附图8为扣除荧光背景拉曼光谱后的真实细胞拉曼光谱。
具体实施方式
本发明多元线性回归拟合获得真实的细胞拉曼光谱的方法,包括如下步骤:
1、如图1所示,包括原始细胞拉曼光谱并做平滑处理;测量7种组成细胞 的基本生化成分的拉曼光谱,并作为多元线性回归拟合的基元变量,该7种组成 细胞的基本生化成分就是细胞的7种基元变量,分别是肌动蛋白、白蛋白、三油 酰甘油酯、卵磷脂、DNA、RNA和糖原;获得细胞拉曼光谱的近似荧光背景, 并作为多元线性回归拟合的背景变量;利用多元线性回归拟合算法对近似荧光背 景进行评估和再拟合计算;根据多元线性回归拟合得到各个背景变量的拟合系 数,确定最终的荧光背景;
2、未经任何处理的原始细胞拉曼光谱如图2所示;
3、对原始细胞拉曼光谱进行Savitzky-golay平滑处理,Savitzky-golay平滑 就是卷积平滑,消除高频窄带噪声,得到平滑后的平滑拉曼光谱,平滑拉曼光谱 英文减缩为SS,如图3所示;
4、图4为组成细胞7种基元变量的基元变量拉曼光谱,该细胞的7种基元 变量是指细胞的7种基本生化成分,它们已经被证明可以有效地表征组成细胞的 基本生化成分,其中a代表肌动蛋白、b代表白蛋白、c代表三油酰甘油酯、d 代表卵磷脂、e代表DNA、f代表RNA、g代表糖原;
5、利用现有拉曼光谱荧光背景算法,估算出SS的近似荧光背景并作为多元 线性回归拟合算法中的背景变量。图5所示分别表示用自适应最小迭代二乘算 法、五项式拟合算法和四项式拟合算法估算出3种荧光背景;
6、采用多元线性回归拟合方法,即用7个基元变量和3种荧光背景变量进 行线性叠加拟合SS。图6所示为拟合得到的10个变量,图7所示为拟合得到的 细胞拉曼光谱。可以看出,拟合拉曼光谱中的一些谱峰与原始拉曼光谱没有完全 重合,其主要原因是7个基元变量并不能完全表征组成细胞的所有生化成分,但 是这完全不会影响对最后荧光背景的计算结果。
7、表1所示为用多元线性拟合算法得到各个变量的拟合系数,而荧光背景 的确定就用各个背景变量与其对应的拟合系数的乘积之和来确定;
表1:用多元线性回归方法拟合出的各变量拟合系数和荧光背景
8、图8所示真实细胞拉曼光谱,用平滑拉曼光谱减去上述步骤得到的荧光 背景拉曼光谱,得到真实的细胞拉曼光谱。
机译: 拉曼探针拉曼光谱获得装置使用拉曼探针的拉曼光谱获得方法和靶材分布探测方法
机译: 拉曼探针,拉曼光谱获得装置以及使用拉曼探针获得拉曼光谱并检测目标物质的分布的方法
机译: 拉曼探针,拉曼光谱获得装置以及使用拉曼探针获得拉曼光谱并检测目标材料的分布的方法