首页> 中国专利> 时间和/或空间序列文件的多组分回归/多组分分析

时间和/或空间序列文件的多组分回归/多组分分析

摘要

MCR(多组分回归)估算如从红外或其他光谱学提取的纯组分时间和/或空间序列光谱,这些光谱能够与参考库中的光谱进行比较以找出最佳匹配。然后这些最佳匹配光谱各自进而可以与这些参考光谱相组合,其中也对这些组合进行筛选,以找出对估算的纯组分时间序列光谱中的任一光谱的最佳匹配。然后,这些结果最佳匹配也可以经历上述组合与比较步骤。若希望,该过程可以按此方式以不受限制的方式重复进行,直到达到一个适当的停止点,例如,当标识出希望数量的最佳匹配、当已经执行了某一预定数量的迭代、等等。如果考虑参考光谱的所有可能的组合,本方法能够用少得多的计算步骤以及更快的速度来返回最佳匹配光谱。

著录项

  • 公开/公告号CN104024830A

    专利类型发明专利

  • 公开/公告日2014-09-03

    原文格式PDF

  • 申请/专利权人 热电科学仪器有限公司;

    申请/专利号CN201280050878.5

  • 申请日2012-10-17

  • 分类号G01N21/35;G01J3/28;

  • 代理机构上海专利商标事务所有限公司;

  • 代理人姬利永

  • 地址 美国威斯康星州

  • 入库时间 2023-12-17 02:09:03

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-05-31

    授权

    授权

  • 2014-10-08

    实质审查的生效 IPC(主分类):G01N21/35 申请日:20121017

    实质审查的生效

  • 2014-09-03

    公开

    公开

说明书

发明背景

发明领域

本发明涉及光谱分析领域,并且更确切地涉及当希望时将多组分 回归与多组分光谱匹配组合使用的演化时间序列光谱的自动标识。

相关技术讨论

分子光谱仪(有时被称作分光镜)是一种仪器,其中,通常利用 不可见光(如光谱的红外区域内的光)来照射固态的、液态的或气态的样 品。然后,将来自该样品的光捕获并且进行分析,用以揭露该样品特征的 信息。举例来讲,样品可以用在一定波长范围内具有已知强度的红外光进 行照射,然后被该样品透射和/或反射的光可以被捕获以用来与光源进行比 较。对所捕获的光谱进行检查可以展示出该照射光被该样品吸收的波长。 该光谱,并且特别是其中峰的位置以及幅度,可以与之前-获得的参考光谱 进行比较,以获得关于样品的信息,例如,它的成分以及特性。本质上, 该光谱充当该样品以及其中物质的一个“指纹”,并且通过将该指纹与一个 或多个已知的指纹进行匹配,可以确定该样品的身份。

当使用这类上述方法收集取决于时间的数据时,如,例如在化学 反应监控(动力学)或用气体排放的热分析(TGA-IR)或色谱分析法(GC-IR) 中,存在许多偶然性。此分析的最冗长的步骤是从连接的光谱序列中提取 独立的谱随后进行这些单独光谱的分析。在GC-IR中,光谱通常用于纯组 分,GC进行分离,但在TGA-IR中,单独的光谱本身还可以是混合物。

因此应认识到,如果希望将一个演化样品的多个时间序列光谱与 一个或多个参考光谱的所有可能的组合进行比较,则这通常会是一个极其 巨大的数字,特别是大的参考库可以具有成千上万的条目的情况下。如果 在进行定性分析之外,还要进行定量分析,即,在确定未知光谱中每个光 谱成分的身份之外还要确定其相对比例的情况下,那么进行这些比较需要 的计算时间可以被进一步放大。这种定量分析可以要求在多个参考光谱的 组合针对光谱时间序列之间执行回归,以确定每个参考光谱为了形成最佳 匹配的组合中应该具有的权重。其结果是,即使使用了专用计算机或具有 高速处理器的其他机器,执行彻底的光谱匹配有时会花费几个小时,甚至 几天的时间。

2010年4月13日授予Ritter等人的题为“特别用于多组分光谱的 高效光谱匹配(EFFICIENT SPECTRAL MATCHING,PARTICULARLY  FOR MULTICOMPENENT SPECTRA)”的美国专利号7,698,098B2中描述 并要求保护一种用于使用多组分分析使未知光谱进行光谱匹配的方法的背 景信息,该背景信息通过引用以其全部内容结合于此,包括以下内容“从红 外或其他光谱法获得的未知光谱可以与参考库中的光谱进行比较以找出最 佳匹配。然后这些最佳匹配光谱各自进而可以与这些参考光谱相组合,其 中也对这些组合进行筛选,以得到对未知光谱的最佳匹配。然后,所产生 的这些最佳匹配亦可以经历上述的组合与比较步骤。该过程可以按此方式 重复进行,直到达到一个适当的停止点,例如,当标识出希望数量的最佳 匹配、当已经执行了某一预定数量的迭代、等等。如果考虑了参考光谱的 所有可能的组合,这种方法能够用少得多的计算步骤以及更快的速度来返 回最佳匹配的光谱(及光谱的组合)”。

2006年7月4日授予Schweitzer等人的题为“用于通过光谱分析 标识混合物的组分的方法(METHOD FOR IDENTIFYING COMPONENTS  OF A MIXTURE VIA SPECTRAL ANALYSIS)”的美国专利号7,072,771B1 中描述并要求保护一种组分光谱分析的方法的背景信息,包括以下内容“本 发明总体上针对光谱分析领域,并更具体地针对一种使用包括潜在候选者 的光谱库从由混合物中收集的光谱集合中标识出混合物的未知组分的改进 方法。例如,本方法针对通过包括以下内容的步骤来标识混合物的组分: 获得一个限定混合物数据空间的混合物光谱数据集合;根据已知元素的多 个库光谱到该混合物数据空间中的投射角对库光谱进行排序;为排序最高 的y个库光谱的每个组合计算一个校正的相关系数;以及选择具有最高校 正的相关系数的组合,其中,已知元素的所选择的组合被标识为该混合物 的组分”。

发明概述

本发明针对一种用于对由一个或多个演化样品产生的序列数据 文件进行分析的自动化方法。具体地,使用MCR或多组分回归,可以首先 通过分析提取一系列线性独立的光谱。技术上,MCR结果被称为“因子”, 并且经常通过MCR产生一个因子集合;并且当重新组合时,这些因子可以 重现原始数据集合。如在此描述的,MCR然后可以针对将这些因子传递至 多组分搜索(MCS)途径,该途径可以使针对所提供的数据库搜索的因子 去卷积。这种过程的最终结果能够标识出原始数据集合内存在的每个组分。

该途径可以通过执行用原始数据集合标识的组分的光谱相关来 完成该分析。实质上,这通过将组分光谱与原始数据集合内的那些光谱进 行比较并提供一个值来完成,该值示出在那个时间点存在多少该组分。此跨 整个时间演化的数据集合的总结产生一个特征曲线,该特征曲线展现每个组 分的存在的时间历史。最终,这产生示出每个组分的时间依赖性的特征曲 线序列。

如希望,最终报告经常可以被定制成由所提取的光谱、搜索结果、 以及每个所标识的组分的特征曲线组成。这克服了现有技术存在的几个问 题:

·处理数据库内所有的光谱用于信息提取。

·用户不必具有样品的一些初始知识。

·用户不需要具有关于分析软件的任何技能。

·大大加快了最终分析的速度。

相应地,本申请的一个第一方面包括一种用于分析来自演化样品 的光谱的方法,该方法包括:利用一个光谱仪获得一个时间和/或空间序列 光谱集合;通过使用一台计算机通过回归方法从该时间和/或空间序列光谱 集合中的每个光谱来估算一个或多个定性且定量的组成组分;以及利用一 台计算机将从该时间和/或空间序列光谱集合中的每个光谱所估算的一个或 多个定性且定量的组成组分传递到一个多组分搜索(MCS)算法中,该算 法被配置成用于迭代地使一个或多个光谱库内存放的一个或多个比较光谱 与作为一个或多个对应的定性且定量的组成组分展现的所估算的时间和/或 空间序列光谱集合中的每个光谱相关,其中,该结果是迭代地确定的一个 或多个候选光谱的最佳匹配的时间和/或空间序列集合。

本申请的一个第二方面包括一种用于分析来自演化样品的光谱 的系统,该系统包括:一个光谱仪,被配置成用于生成一个时间和/或空间 序列光谱集合;以及一台计算机,被配置成用于通过一种回归方法从该时 间和/或空间序列光谱集合中的每个光谱来估算一个或多个定性且定量的组 成组分,其中该计算机将从该时间和/或空间序列光谱集合中的每个光谱所 估算的一个或多个定性且定量的组成组分传递到一个多组分搜索(MCS) 算法中,该算法被配置成用于迭代地使一个或多个光谱库内存放的一个或 多个比较光谱与作为一个或多个对应的定性且定量的组成组分展现的所估 算的时间和/或空间序列光谱集合中的每个光谱相关,其中,结果是迭代地 确定的一个或多个候选光谱的最佳匹配的时间序列集合。

附图简要说明

图1A示出了一个示例性样品的序列时间文件的给定时间点的光 谱。

图1B示出了由图1A的光谱的去卷积产生的二氧化碳、氨、异氰 酸以及水的MCR估算的纯组分吸收光谱。

图1C示出了图1B中所示的示例性估算的纯组分的量化时间特征 曲线。

图2总体上展示了由多组分回归产生的估算的纯组分P1、P2和 P3的示例性序列时间文件,其后与从一个或多个光谱库获得的参考光谱L1、 L2和L3进行比较。

图3示出了图2中所示的展示的更加详细的版本。因此,示出了 将所估算的纯组分光谱(表示为P1、P2和P3...)与参考光谱(L1、L2和L3...) 进行比较以确定这些纯光谱与这些库光谱相符合的程度。如果这些纯组分 光谱与这些库光谱匹配达到所希望的程度,则认为这些比较库光谱是候选 光谱(Bi)。

图4是为一个流程图,描绘了图3中的匹配方法,其中框400等 效于图3中的步骤200,框430等效于图2中的步骤210与220(以及这些 步骤的后续重复),而条件框440施加了一个停止条件,用于将候选光谱 报告给用户(在框450处)。

图5描绘了候选光谱的一个实例性输出报告,该报告可以在对所 估算的纯组分时间序列光谱执行MCR和/或MCR-MCS匹配方法之后展现 给用户。

详细说明

在本发明的说明书中,除非隐含或明确地理解或另外地陈述,应 理解一个以单数出现的词语涵盖它的相对应的复数,并且以复数出现的词 语涵盖它的相对应的单数。另外,除非隐含或明确地理解或另外地陈述, 应理解在此描述的任何给定的部件或实施例、对该部件列出的任何可能的 候选或替代物可总体上被单独使用或者彼此组合使用。此外,应当了解如 在此示出的图不一定是按照比例绘制的,其中这些元件中的一些可能仅仅 是为了本发明的清晰而绘制出。并且,参考数字在各图中可能重复,以示 出多个相应的或类似的元件。另外,除非隐含或明确地理解或另外地陈述, 应理解这样的候选或替代物的任何列表仅仅是说明性的,并不是限制的。 此外,除非另外指示,否则在说明书和权利要求中使用的表示组成部分、 组成成分、反应条件等等的数量的数字应被理解为是由术语“大约”修饰的。

因此,除非相反地指示,否则在本说明书和所附权利要求书中阐 述的数值参数是近似值,可取决于试图通过在此呈现的主题来获得的所需 要的特性而不同。至少,并且不是试图限制等价物原则对本权利要求范围 的应用,应当至少根据报告的有效位数的数字并且通过应用寻常的舍入技 术来解释每个数值参数。尽管阐述在此呈现的主题的广泛范围的数值范围 和参数是近似值,但是在具体实例中阐述的数值是尽可能准确地报告的。 然而,任何数值本质上就包含了必然由它们相应的测试测量中所存在的标 准偏差引起的某些误差。

整体说明

分析序列数据文件(例如,光谱的时间序列)的最冗长的步骤是 逐一提取然后进行单独光谱的分析,光谱本身可以是混合物。这种分析方 法耗时并且需要某种技能和“技艺”来有效地实施。此外,这样一种逐一提 取方法将用户限制到分析文件的被标识为用户“感兴趣”的较小区域。为了 以一种新颖的方式克服这种冗长乏味,在此披露的实施例包括一种使用多 组分回归(MCR)的自动化过程,该过程对被询问的样品内的纯组分进行 估算,该过程后经常是多组分搜索(MCS)方法,该方法利用一个或多个 光谱库的不受限定(如果被配置成用于这样做)搜索条件。2010年4月13 日授予Ritter等人的题为“特别用于多组分光谱的高效光谱匹配 (EFFICIENT SPECTRAL MATCHING,PARTICULARLY FOR  MULTICOMPENENT SPECTRA)”的美国专利号7,698,098B2中描述了这 样一种MCS方法,该专利通过引用结合于此。

因此,本发明的MCR-MCS组合方法向用户提供了一种有益且新 颖的工具,该工具不仅使提供用户之间一致性的有用过程简化而且还使其 自动化。具体地,在此披露的MCR-MCS方法可以提供数据集合的全部和 完整的分析,从而使得现在能够看到即使可能一直被常规方法忽视的小项 目,以使用户以有用的方式对其进行解释。例如,本发明实施例的有益用 途是示出不同组分的时间行为的特征曲线的叠加(overlay)。这样一种结 果提供了客户所寻求的事物,即,对定时事件过程中数据如何演化的深入 检查。

对于最终用户,这意味着可以得知快速、完整的记事。例如,可 以对两种或更多种材料(区别仅在于某种添加剂)的特征曲线(何物和何 时)进行比较,从而告知用户不同之处。在存在相同材料但总体过程不同 的情况下,时间演化图可以展示不同的生产过程如何影响材料。重要的是, 本发明的方法对任何技能水平的用户而言都是可用的,意味着例如在材料 的FT-IR分析中没有专业知识的药物实验室、或具有低技能用户的基础分 析实验室现在可以获得高质量的结果。

具体说明

在此披露的多变量组分解析(MCR)方面针对在对正在询问的演 化样品中包含的混合物没有任何事前了解的情况下从未知混合物光谱的时 间序列集合回归地提取纯组分的浓度时间特征曲线和所估算的光谱的集合 的一种数学方法。相应地,应认识到,本申请的自动化处理性质以MCR开 始,以便从所收集的光谱数据序列中提取一系列线性独立的因子。实质上, 这些因子表示该光谱序列到其组成部分的蒸馏(distillation),即,当组合 时,这些光谱描述了该数据。作为非限制性展示,在此披露的MCR方法的 这样一种时间序列数据集合可以用来可以随着对应的相对浓度提取荧光样 品的估算“纯组分”(例如,荧光团),以便提供来自这种单独的估算的“纯” 组分的量化贡献。

作为一种操作方法,因此通过利用如对本领域普通技术人员而言 熟知的任何数量的方式首先获得所测量的吸收光谱针对时间,如(但不限 于)热重量分析(TGA),以产生一个与图1A中所示的那个类似的时间序 列光谱数据集合(从演化样品收集的光谱)。初始目标是对组成该时间序 列光谱集合的“纯组分”进行估算。

相应地,尽管多组分回归(MCR)可以通过该分析过程提取所希望 的线性独立光谱序列,然而应认识到,MCR软件不能在带有一个组分或十个 组分的光谱之间进行区分,而仅可以提取示出独立时间演化的光谱。例如,如 果氨和水同时从样品演化,则如在此利用的MCR软件可以提出氨加水的光谱, 而不是分开的氨光谱和水光谱。另一方面,如果异氰酸酯也演化但在不同的时 刻,则即使所得的光谱与氨加水光谱重叠,结果可以示出氨加水和异氰酸酯。

具体地转至图1A、图1B和图1C,所示的图展现了如通过仪器操作 接收的并且之后使用本发明的多变量曲线解析(MCR)方法步骤提取的演化环 氧树脂样品中包含的二氧化碳、氨、异氰酸和水的示例性数据。具体地,图1A 中所示的光谱示出了通过样品的热重量分析(TGA)获得的吸收光谱在时间中 的快照。用户可以使用设计的前端来收集这种数据,从而产生与图1A类似的 光谱的序列时间文件。

图1B分别示出了由于所接收到的光谱的序列时间文件的MCR分析 产生的估算的纯组分(例如,二氧化碳、氨、异氰酸和水)的吸收光谱,图1A 中说明性地示出了其中之一。最后,图1C示出了所得到的对于图1B中所示 的估算组分的MCR产生的时间特征曲线。

作为在此披露的MCR算法的仍然普遍但更详细的描述,首先通过 对本领域普通技术人员而言熟知的方式收集与图1A类似但针对时间测量的吸 收光谱集合。内置MCR的软件调用该吸收光谱集合S(数据点的光谱x#)。 应注意的是,MCR软件包的初始目标是对组成该光谱集合的“纯组分”进行估 算。开始,纯组分被称为P(纯组分x数据点的#),并且C(光谱x纯组分) 被认为是每个光谱中的每个纯组分的量值。

其结果是,对于纯组分矩阵S的给定实际光谱而言,其中每行与混 合物的一个光谱相关,产生下式:

1)             S=PC

在此,P和C为向量矩阵,如上所述,其中P为“纯组分”(即,纯 组分x数据点的#),并且每个光谱中的每个纯组分的量值为C(光谱x纯组 分)。此外,应注意的是,“纯组分”(即,纯组分x数据点的#)令人希望地 与由该序列时间文件产生的估算组分的总数大约相同。因此,就最主导的单独 组分强度在这个或这些演化样品内如何变化而言,由上述方程式1得到的相关 光谱令人希望地产生最佳估值。

此外,还应注意到,在此披露的MCR方法步骤还有益地利用了多 个限制,例如,如单峰性限制,但更经常地为非负性约束。作为优选限制,经 常基于对数据的特定了解来选择非负性约束;例如,该吸收测量结果应是正的, 以便在可能经常受到测量模糊性阻碍的数据中提供增强的数据强度和样品浓 度。因此,使用非负性约束进一步将C和P两者都限制成非负性的,即,c(i, j)>=0并且p(j,k)>=0;(其中i相当于在j波长下用分光光度法测量k 次的样品数量)。

为了开始迭代过程,MCR必须首先猜测组分的数量。已经提出了多 种用于估算组分数量的策略,但最后每个策略中存在某种任意性。该技术必须 从所测量的光谱的时间序列集合或从光谱的空间收集来估算纯组分光谱和浓 度两者。这在被称为交替最小二乘法的迭代过程中完成。第一步是关于纯组分 光谱或者浓度特征曲线的形状的任意猜测。

如果任意猜测纯组分光谱,则对最小二乘法问题S=PC求解C, 其中约束为所有cjk>=0。这通过被称为非负最小二乘法(NNLS)的迭代过程 完成。它产生C的估算值。此C的估值(对于这些光谱的浓度)然后用来对 纯组分光谱P进行新的估算。即,通过NNLS对问题S=PC求解P。该技术 为NNLS的事实保证了所有pij>=0。继续进行重新求解C并且然后重新求解 P的步骤,直到解收敛。几次迭代之后出现此情况。结果是,对于纯组分光谱 P、以及对于将产生测量光谱的收集S的光谱浓度C的类最小二乘解。

应注意到,纯组分估算值为近似值并且尚未被证明与任何实际物理 材料的光谱匹配。然而,其对于MCS(多组分搜索)分析而言是一个有意义 的开始点。

之后,如图1B(即,得到估算的纯组分)和图1C(即,得到每 个估算纯组分的浓度时间特征曲线)类似地所示,MCR可以在图表或绘图 中向用户提供估算的组分和浓度以示出时间依赖性。

然而,如上所述,应认识到,本发明的有益方面是将MCR分析 方法与MCS(多组分搜索)算法进行整合的能力,2010年4月13日授予 Ritter等人的题为“特别用于多组分光谱的高效光谱匹配(EFFICIENT  SPECTRAL MATCHING,PARTICULARLY FOR MULTICOMPENENT  SPECTRA)”美国专利号7,698,098B2中类似地描述了该能力,该专利通过 引用结合于此。如以下进一步详细描述的,这样一种MCS过程通常对如针 对所提供的数据库搜索的单独光谱进行去卷积。因此,MCS通过执行使单 独光谱与原始数据集合相关的光谱相关来提供由MCR产生的每个估算组 分的标识。总体的有益结果为产生与图1A和图1C的那个类似的通常增强 的精确估算组分和时间特征曲线,即,为用户提供演化样品中的每个组分 的甚至更可信的依赖时间的信息。

现在示意性地示出图2提供了对MCR-MCS的新颖的整合方面的 一般理解。具体来讲,如图2中所示的P1、P2、P3…表示使用MCR软件从 光谱仪获得的估算的纯组分时间序列光谱。这种如通过MCR提供的估算的 光谱信息(即,P1、P2、P3)然后传递至该MCS软件方面以与之前获得的 参考比较光谱(表示为L1、L2、L3…)进行比较。

图3在某种程度上详细描述了图2的估算的时间序列纯组分光谱 P1、P2、P3如何与这些比较(库)光谱中的一些光谱进行比较以确定这些 纯光谱与这些比较库光谱L1、L2、L3…相符合的程度(现在在图3的步骤 200中示出)。

具体地,一旦从光学仪器(例如,光谱仪)、数据库、或对本领 域的技术人员熟知的任何来源获得如在步骤200所示的光谱的估算的时间 序列P1、P2、P3...,并且随后使用MCR处理,如上所讨论的,可以用以下 方式对比较库光谱(例如,L1、L2、L3)进行标识。

首先,从一个或多个光谱库或其他来源中获取多个比较光谱,即, 用于比较的一个或多个参考光谱。然后将通过MCR提取的一个或多个估算 的纯组分时间序列光谱P1、P2、P3...与这些比较光谱中的至少一些光谱进 行比较以确定这些这些时间序列光谱与该一个或多个比较光谱相符合的程 度。如果这些估算的纯组分时间序列光谱P1、P2、P3....与一个或多个比较 光谱相符合达到所希望的程度,如通过满足或超过某个用户定义或预设的 符合度阈值,只要该符合度阈值没有设置得太高,则该一个或多个比较光 谱被认为是被标识为一个或多个候选光谱B(1)1、B(1)2.....B(1)M。如果没有 识别出候选光谱,可将符合度阈值设定为一个更低的值。

其次,考虑以下可能性:这些估算的纯组分时间序列光谱中的任一 光谱可能已经从一种多组分混合物中出现。生成多个新的比较光谱,其中每个 比较光谱是先前识别出的候选光谱之一与来自这些光谱库或其他来源的比较 光谱之一的一种组合。然后,再次将所估算的一个或多个纯组分时间序列光谱 与这些新的比较光谱中的至少一些光谱进行比较,以确定这些估算的纯组分时 间序列光谱与这些新的比较光谱相符合的程度。在图3中的210示意性地示出 了本步骤,其中任意数量的估算的纯组分时间序列光谱P1、P2、P3...与新的比 较光谱进行比较:

B(1)1+L1,B(1)1+L2,...B(1)1+LN

(即,将之前从图3的步骤200中识别出的候选光谱中的第一光谱与来 自这些光谱库或其他来源的比较光谱中的每个比较光谱进行组合);

B(1)2+L1,B(1)2+L2,...B(1)2+LN

(即,将之前从步骤200识别出的候选光谱中的第二光谱与来自这些光 谱库或其他来源的比较光谱中的每个比较光谱进行组合);并以此类推, 直到将这些估算的纯组分时间序列光谱与新的比较光谱进行比较:

B(1)M+L1,B(1)M+L2,...B(1)M+LN

(即,将之前从步骤200识别出的候选光谱中的最后一个光谱与来自这 些光谱库或其他来源的比较光谱中的每个比较光谱进行组合)。

当这些比较发现例如这些新的比较光谱中的任一个光谱具有与 这些估算的纯组分时间序列光谱P1、P2、P3...所希望的符合程度(如通过 满足或超过该符合度阈值),认为该新的比较光谱是新的候选光谱。这些 新的候选光谱在图3的步骤210中被描述为B(2)1、B(2)2、…B(2)M。(应 理解,若希望,步骤210中的M不需要与步骤200中的M相等,即,步骤 210中的候选光谱的数量不需要与步骤200中的候选光谱的数量相同。)在 此每个候选光谱B(2)1、B(2)2、…B(2)M代表两个组分,即,从一个光谱库 或其他来源获得的两个相组合的参考光谱。

然后,若希望,可以用不受限制的方式重复上述步骤一次或多次, 其中每次重复都使用在前一个步骤中标识的候选光谱来生成新的比较光 谱。图3中的步骤220举例说明了上述情况,其中来自步骤210的候选光 谱B(2)1、B(2)2、…B(2)M与来自这些光谱库或其他来源的比较光谱L1、 L2、…LN组合使用以生成新的比较光谱。这些估算的纯组分时间序列光谱 P1、P2、P3…与这些新的比较光谱的比较进而标识出新的候选光谱B(3)1、 B(3)2、…B(3)M(其中M再次不需要与步骤210和/或200中的M相等)。 当这些候选光谱包括某一希望数量的组分时,例如,一旦这些新的比较光 谱包括从一个光谱库或其他来源获得的一个希望数量的组合的比较/参考光 谱时,就可以停止重复。

图4的流程图中示出了此条件,其中,步骤400等效于图3中的 步骤200,步骤430等效于图3中的步骤210与220(以及这些步骤的进一 步重复),而条件框440对在这些候选光谱中的组分数量c进行了求值, 并且一旦达到某一最大数量C,即停止重复。可替代地或者另外地,在以 下情况下可停止重复,即:当识别出某一希望数量的候选光谱时;当识别 出以至少某一合格的符合度值(该合格的符合度值大于该符合度阈值)与 该未知光谱相匹配的一个或多个候选光谱时(如下所讨论的);或者当其 他合适的条件出现时。

然后,可以将至少这些候选光谱中的某些光谱展现给用户,其中 这些候选光谱优选地以排列好的次序展现给用户,从而使得首先展现与该 未知光谱具有更高符合度的那些候选光谱(如在图4中步骤450所描绘)。 图5中展示了一个可能展现给用户的候选光谱的输出列表的实例性格式。 在此,在输出列表的标题中给出了关于该未知光谱的详情,随后是候选光 谱的细节。第一个列出的候选光谱(以等级/指数1列出的候选光谱)是一 个聚苯乙烯薄膜的光谱,并且具有对该未知光谱为99.58的一个匹配尺度 (大致等于一个“匹配百分比”)。这个候选光谱的光谱库或其他来源也被 列出(在此是“用户示例库”),同样还有它在该库/来源中的位置(位于“源 索引”2号,即,它是“用户示例库”所提供的第二光谱)。第二列出的候选 光谱实际上是来自多个光谱库或其他来源的三个光谱的一个组合:一个甲 苯(透射单元)光谱,一个ABS塑料(ATR校正的)光谱,以及一个聚四 氟乙烯薄膜光谱,其中,当这些光谱以合适的比例组合时(如下所述)给 出与该未知光谱成68.97的一个匹配尺度。它们的累积匹配尺度也被展现, 其中甲苯具有一个56.96的匹配尺度,甲苯与ABS一起具有一个68.92的 匹配尺度,而甲苯、ABS与聚四氟乙烯共同地产生一个68.97的匹配尺度。 再一次,提供了这些光谱的库或者其他来源连同每个光谱在其库/来源中的 位置的指示。

随同该输出列表中还优选地提供了多个额外的度量,具体地,提 供了候选光谱中的每个比较光谱(每个组分/参考光谱)的权重,即,用于 调整每个比较光谱以得到与该未知光谱的最佳匹配的比例因子。例如,该 第一被列出的候选光谱(聚苯乙烯薄膜)具有权重5.4195,这意味着该未 知光谱被估计为具有得到该候选光谱的样品中聚苯乙烯的含量的5.4195 倍。该第二个被列出的候选光谱包含不同权重的甲苯、ABS、以及聚四氟 乙烯,其中这些权重是在上述比较步骤过程中,通过对这些比较光谱相对 与该未知光谱的回归分析而确定的(即,在一个比较光谱中的不同的组分/ 参考光谱是按比例设定的,以便在比较过程中获得与该未知光谱的最佳匹 配)。因此,可以提供给用户该未知光谱之中这些组分的一个至少近似的 量化。

以上方法可以被称为是寻找“最佳匹配”的参考光谱、将该最佳匹 配光谱与其他参考光谱相组合,并且然后从这些组合中标识进一步的最佳 匹配光谱(其中从上述组合步骤开始该方法迭代式地继续)。因此可以看 出,不是比较参考光谱L1、L2、…LN的所有可能组合,而是该方法基本上 是通过略去与未知光谱具有较小相似度的参考光谱,从而可以考虑少得多 的组合。其结果是,与考虑所有组合的方法相比,该方法在短得多的时间 内返回高质量的匹配,特别是在使用数量很大的参考光谱以及用更大的组 分/参考光谱的组合来评审该未知光谱时(在某些情况下,只需几分钟即可 返回之前需要数小时的结果)。

在执行上述估算的纯组分时间序列光谱与比较光谱之间的比较 之前,本发明可以在估算的纯组分时间序列光谱和比较光谱中之一或二者 上都执行一种或多种变换,以便加速比较过程和/或者提高比较过程的准确 度,或者另外地增强数据处理。例如,本发明可以对光谱进行数据平滑(噪 声抑制)、峰值辨别、标度变换、域变换(如变换为矢量格式)、微分、 或其他变换中的一个或多个。比较本身也可以采取多种形式,如在未知光 谱与比较光谱之间简单地比较在相似波长范围上的强度或幅值,将未知光 谱与比较光谱转换为向量形式并比较这些向量,或采取其他的比较形式。

此外,可以修改上述方法以进一步加快候选光谱的标识。作为这 样一个修改的一个示例,当通过组合一个之前标识的候选光谱与取自光谱 库或其他来源的一个比较光谱以生成一个新的比较光谱时,若该候选光谱 已经包括了该比较光谱,则可以跳过或者放弃该组合(即,删除或不计作 潜在的新的候选光谱)。

为了更确切地说明,考虑在步骤200(图3)中,由于与未知光 谱的充分匹配,将从一个光谱库获得的比较光谱L1选定为B(1)1的情形。 在步骤210的下一次迭代中,新的比较光谱B(1)1+L1可以被跳过或者放弃, 因为它等效于L1+L1(即,参考光谱L1与其自身相组合,这仅仅将会再次 产生L1)。因此,通过避免生成和/或使用具有冗余组分光谱的比较光谱, 该方法可以保留用于更可能产生出新的候选光谱的比较光谱的计算时间。

作为可以为了加快候选光谱的标识而实施的修改的另一个实例, 若一个候选光谱以大于或者等于某一“合格的”符合度值(该合格的符合度 值大于符合度阈值)与该未知光谱匹配,则其中这些比较光谱(即,其组 分光谱)可以从任何后来的新比较光谱的生成中排除。本质上,这一措施 所采取的手段是:若一个候选光谱已经是对一个未知光谱的非常良好的匹 配(比如,如果它具有大于95%的一个合格的符合度值),这就已经足够, 而不再特别需要再确定若该候选光谱与其他光谱组合是否会有更高的匹 配。

为了加快候选光谱的标识而可以做出的另一种修改应用于一种 特殊的情形,其中该未知光谱的一个或多个组分是已知的,例如,当监控 旨在以预先确定的量生成具有已知组分的材料的过程的输出时。在这种情 况下,在第一轮比较过程中(图3中的步骤200,图4中的步骤400),可 以简单地将候选光谱B(1)1、B(1)2、…B(1)M设置成就是这些已知组分的光 谱。于是执行本方法的剩余部分将用来识别出可能存在的任何其他组分(即 杂质),以及不同组分的相对比例。

如上所述,如果符合度阈值设置得太高,即,估算的一个或多个 纯组分时间序列光谱与一个比较光谱之间的、使该比较光谱被认为是候选 光谱所需的匹配度,则结果会是不产生候选光谱。典型地,一个90%的符 合度值适于作为该符合度阈值,尽管取决于所考虑光谱的细节该值可以被 更好地设定为更低或更高。

将该符合度阈值设定为零(或者接近于零的一个值)也是可行的, 在这种情况下,因此可以从每个比较光谱产生一个候选光谱。例如,如果 在图3和图4中的步骤200中,该符合度阈值被设定为零,则M=N且B(1)1、 B(1)2、…B(1)M将各自与L1、L2、…LN之一相符合。在这种情况下,由于 与该未知光谱的不良匹配,某些候选光谱事实上会是一些不良候选者。然 后将这些候选光谱以从最高符合度到最低符合度的顺序排列是有用的,并 且然后在执行任何后续步骤时,首先考虑那些具有最高符合度的候选光谱。 在这种情况下,为了减少计算,在执行任何后续步骤时放弃具有最低符合 度的候选光谱可以是有用的。例如,可以只保留具有最高符合度的最上部 10%、25%或50%的候选光谱,并在后续步骤中使用它们。

所预期的是,本发明可以被实现在光谱标识软件中以便在计算机 或其他接收并分析光谱数据的系统(例如,光谱仪)中使用。此类系统可 以包括便携式或手持式计算机、现场测量装置、环境设备、工业设备或其 他监视设备中提供的专用集成电路(ASIC)和/或可编程逻辑器件(PLD), 以及可以证明本发明有用的任何其他系统。

作为一个附加实施例,以下非限制性示例展示了可以与在此披露 的方法一起利用的有益的用户输出界面方面。应认识到,潜在地可以用这 些实施例解决的高度相关的问题涉及两种相似材料的分析。两种示例情景: 第一,来自一个批次的垫圈或O形环发生故障而来自另一批次的那个工作 良好。第二,竞争者B已经介绍了一种与竞争者A制作的产品在化学上类 似的产品,并且A希望理解加工中的不同点。在两种情况下,TGA-IR经 常是一种有待实施的富有洞察力的有益方法,其中提供了定性和定量数据。

因此可以有益附加地提供一种“灯箱(light box)”(即,数字地 重叠(或并排呈现))(本发明的延伸),这涉及到在两个数据集合上执 行联用的分析(即,不是按顺序而是同时)。最终结果可以是成分信息和 特征曲线信息的序列。该输出界面可以提供搜索结果的视图和那些组分的 时间演化特征曲线的视图。一个重要的方面是这些比较之间的不同点。

如果这些分析被配置成按顺序完成,则搜索结果的排序和所找到 的组分的数量可以潜在地不同,从而使得比较更加复杂。通过以一种联用 的方式执行分析,这些结果通过搜索结果的成分和排列排序两者而链接。 这允许该“灯箱”方法,其中数字地重叠(或排呈现)这些结果以便容易进 行比较。

返回参照那两个情景,在该第一情况下,该重叠视图可以示出缺 失一种组分(配方错误),或示出在两者之间一个或多个组分的温度演化 特征曲线的偏移(处理错误)。在该第二情景下,配方分解特征曲线允许 来自公司A的带有已知特性的已知产品与公司B的未知材料进行比较;或 者再一次引出成分或加工不同点。最终,这代表整个分析一直要得出的“最 终答案”,这两个样品的不同之处。

此外,尽管本发明被总体地描述为在分子光谱仪的光谱匹配的背 景下是有用的,但是它可以替代地或附加地用于质谱学、X射线光谱学或 其他形式的光谱学中。另外它在其他形式的测量分析中也可以是有用的, 其中信号相对于参考信号而测定的,在这种情况下,这些信号和参考值可 以被视作本发明背景中的“光谱”。

应当理解在此描述的关于不同实施例的特征在不脱离本发明的 精神及范围下,可以任意组合相混合及匹配。尽管所选的不同的实施例已 被展示并详细描述,应理解它们是示例性的,并且在不脱离本发明的精神 及范围下,多种取代及改变是可能的。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号