首页> 中国专利> 基于子空间重合判断的混合光谱模式识别方法

基于子空间重合判断的混合光谱模式识别方法

摘要

一种基于子空间重合判断的混合光谱模式识别方法,涉及化学分析和化学计量领域,该方法是将物质定性仪器测量单元测量到的待定性混合光谱向量,在物质定性仪器的数据信息处理单元中计算其与已知的多个标准样品光谱构成的子空间夹角,通过排列、筛选,判断出符合夹角小于含有最少标准样品数目的子空间,若该子空间与待定性混合光谱向量所处的子空间严格重合,该子空间内所包含的标准样品组成即为待定性混合光谱所含的物质成分组成,从而实现待定性混合光谱中所包含的各种物质的定性识别,识别结果作为物质定性仪器的分析结果输出。本发明能够满足不典型出峰波形,具有与被物含量组成无关、操作简便的优点,适用于光谱分析中多组分体系中的物质定性。

著录项

  • 公开/公告号CN102262054A

    专利类型发明专利

  • 公开/公告日2011-11-30

    原文格式PDF

  • 申请/专利权人 广西工学院;

    申请/专利号CN201110188411.4

  • 发明设计人 姚志湘;粟晖;

    申请日2011-07-06

  • 分类号G01N21/25(20060101);

  • 代理机构柳州市荣久专利商标事务所(普通合伙);

  • 代理人周小芹

  • 地址 545006 广西壮族自治区柳州市东环路268号

  • 入库时间 2023-12-18 03:47:24

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-06-22

    专利实施许可合同备案的生效 IPC(主分类):G01N21/25 合同备案号:2016450000010 让与人:广西科技大学 受让人:西派特(北京)科技有限公司 发明名称:基于子空间重合判断的混合光谱模式识别方法 申请公布日:20111130 授权公告日:20140528 许可种类:独占许可 备案日期:20160525 申请日:20110706

    专利实施许可合同备案的生效、变更及注销

  • 2016-06-08

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G01N21/25 变更前: 变更后: 申请日:20110706

    专利权人的姓名或者名称、地址的变更

  • 2014-05-28

    授权

    授权

  • 2012-11-21

    实质审查的生效 IPC(主分类):G01N21/25 申请日:20110706

    实质审查的生效

  • 2011-11-30

    公开

    公开

说明书

技术领域

本发明涉及一种化学分析和化学计量方法,特别是一种通过对比分析信号、判断被分析样品中物质种类归属的基于子空间重合判断的混合光谱模式识别方法,用于物质定性仪器的定性功能拓展。

背景技术

聚类与分类方法统称为模式识别方法,模式识别方法是化学计量学研究的重要内容。其中根据测定数据完成物质的定性判断是典型的模式分析方法应用。光谱模式识别方法是用于判断物质属性最广泛的模式识别方法,同种物质在同类光谱中具有相同或相近的响应值,通过对比已知物和未知物的光谱可以判定物质的种类和属性。现有的光谱模式识别方法包括峰比对、空间距离、夹角余弦和相关系数等方法。其中,峰比对方法是将物质测量图谱的波峰或波谷位置进行对比,在红外、拉曼、核磁共振、质谱等出峰稳定并且显著的图谱方法中,峰比对方法可以有效判断物质所含的成分或结构情况,通过推理或对比,完成判定。但是对于紫外、近红外等光谱,由于出峰平缓,峰型不典型,另外,即使是出峰显著的各种图谱方法中,在混合体系中出峰可能出现的重叠和覆盖,导致峰值偏移、峰型改变和并合等情形出现,基于峰比对的判断存在限制。而判断峰型不显著的图谱较多采用基于空间距离的“相似性”判断,另外夹角余弦和相关系数也是常用的“相似性”度量指标,但是对于混合体系,由于组成含量的变化会导致峰型出现较大变化,因而导致“相似性”判断不可行。

发明内容

本发明要解决的技术问题是:提供一种能够满足不典型出峰,且适用于多组分体系中物质定性分析的基于子空间重合判断的混合光谱模式识别方法。

解决上述技术问题的基本原理如下:

多组分体系的光谱若采用张量空间描述,每一种物质的光谱可用空间中的一个向量表示,向量的长度(即模量)代表物质含量,而不同光谱特征对应了空间中不同的方向,同一物质的向量在空间中是相同的。如果属于同一物质的光谱,不论物质量如何,其各自对应的向量夹角等于零,这实际就是夹角余弦和相关系数方法的原理。但是在多种物质混合情况下,所得到的光谱向量与纯物质光谱的夹角与体系的物质含量有关,因此,对于混合体系,夹角余弦和相关系数方法不适用。

本发明采用子空间夹角判断空间中向量的归属,实现混合体系光谱中所包含物质的定性。由于在多向量构成的空间中,向量α与其他向量构成的子空间B的夹角定义为αB中所有向量b之间的最小锐角:

  

也就是在通过α的空间B法平面内,法平面与空间B的交线和α构成的锐角;或表述为“净信号”所处向量与α的补角(参见图2所示)。

根据子空间夹角的定义,如果一个向量处在其所处的子空间内,那么该向量与该子空间的夹角等于零。例如两个不平行向量可以张成一个平面,此平面就是一个二维子空间,由这两个向量构成的任意一个向量都处在该平面中,与该平面的夹角为零。

本发明基于如下关键判断:

待定性混合光谱和标准样品光谱数据库中所包含的物质各自构成集合,如果两个集合是真子集,那么它们之间的子空间夹角等于零,但由于受到噪声和误差的影响,该子空间夹角实际是一个很小的正数(即设定值A)。

解决上述技术问题的技术方案是:一种基于子空间重合判断的混合光谱模式识别方法,该方法是将物质定性仪器测量单元测量到的待定性混合光谱向量,在物质定性仪器的数据信息处理单元中计算其与已知的多个标准样品光谱构成的子空间夹角,通过排列、筛选,判断出符合夹角小于含有最少标准样品数目的子空间,若该子空间与待定性混合光谱向量所处的子空间严格重合,该子空间内所包含的标准样品组成即为待定性混合光谱所含的物质成分组成,从而实现待定性混合光谱中所包含的各种物质的定性识别,识别结果作为物质定性仪器的分析结果输出。

本发明的进一步技术方案是:该方法的具体步骤包括:

S1:通过物质定性仪器的测量单元测量待定性混合光谱S,调用物质定性仪器存储单元预存储的含有已知光谱的标准样品光谱数据库L;

S2:在物质定性仪器的数据信息处理单元中用插值法统一测量所得的待定性混合光谱S及标准样品光谱数据库L的数据,即是将物质定性仪器测量单元输出的光谱响应值插值到与标准图谱具有相同的波长或波数刻度;

S3:计算待定性混合光谱S与标准样品光谱数据库L之间的子空间夹角θ;

S4:判断子空间夹角θ是否大于设定值A,如果是,则进入步骤S5;如果否,则进入步骤S6; 

S5:判定为待定性混合光谱S中包含了标准样品光谱数据库L以外的物质,需扩充标准样品光谱数据库L才能完成判断,操作结束;

S6:判定为待定性混合光谱S所包含的物质完全存在于标准样品光谱数据库L内,进入步骤S7;

S7:依次从标准样品光谱数据库L中移出其中的一种物质光谱;

S8:再计算待定性混合光谱S与标准样品光谱数据库L之间的子空间夹角θ;

S9:再次判断子空间夹角θ是否大于设定值A,如果子空间夹角变大,超出设定值A,则进入步骤S10;如果子空间夹角θ未大于设定值A,则直接进入步骤S12;

S10:判定为待定性混合光谱S中含有标准样品光谱数据库L被移出的光谱物质,并将该光谱在标准样品光谱数据库L中的序号记录在数组I中;

S11:将被移出的光谱物质再移回标准样品光谱数据库L,然后再循环执行步骤S7顺序移出下一种光谱,直至标准样品光谱数据库L中的所有光谱均被执行操作;

S12:判定为待定性混合光谱S中未含有标准样品光谱数据库L被移出的物质,然后再循环执行步骤S7顺序移出下一光谱;

S13:判断标准样品光谱数据库L中的所有光谱是否被执行操作,如果否,则循环执行步骤S7操作;如果是,则进入步骤S14;

S14:读取数组I中记录的序号,在标准样品光谱数据库L中找出对应的物质,该物质即为待定性混合光谱S中所包含的物质,将识别结果输出到物质定性仪器的分析结果显示单元,完成定性;

上述各步骤中所述的设定值A为0.05~0.1弧度。

由于采用上述技术方案,本发明之基于子空间重合判断的混合光谱模式识别方法与现有的光谱模式识别方法相比,具有以下有益效果:

采用本发明方法是将光谱视为向量,计算待定性混合光谱向量与标准样品光谱向量张成的子空间夹角,通过排列、筛选,判断出与待定性混合光谱向量所在的子空间严格重合的标准样品光谱向量张成的子空间,混合光谱中所含的各物质即是标准样品空间所包含的各物质,从而实现待定性混合光谱中所包含的各种物质定性。因此,在采用本发明的方法进行判断时,在子空间夹角最小的集合中一定包含了混合物中的所有物质;当子空间未能包含混合物中所有物质时,夹角会出现陡升;而子空间包含混合物所有物质的同时又包含其他物质时,不会导致空间夹角的明显变化,所以空间夹角最小的集合中元素最少的子集就是所需定性的物质。本发明未采用通常的特征峰参数进行定性判别,因此,能够满足不典型出峰的情况,适用于多组分体系中物质定性分析,并且具备有与被物含量组成无关、操作简便的优点。

   下面,结合附图和实施例对本发明之基于子空间重合判断的混合光谱模式识别方法的技术特征作进一步的说明。

附图说明

图1:实施例一所述本发明之基于子空间重合判断的混合光谱模式识别方法的流程框图;

图2:子空间夹角示意图,

图3:子空间夹角计算示意图,

图4:多维空间夹角算法的流程框图,

图5~图9:实施例一所述混合物直接与纯物质图谱的比对图,其中:

图5:混合物和甲醇光谱的对比图;

图6:混合物和乙醇光谱的对比图;

图7:混合物和乙二醇光谱的对比图; 

图8:混合物和丙二醇光谱的对比图; 

图9:混合物和正丁醇光谱的对比图。

具体实施方式

实施例一:

一种用于判断混合物物质组成的基于子空间重合判断的混合光谱模式识别方法,该方法是将物质定性仪器输出的光谱视为向量,不同物质混合成的混合体系的光谱是各个纯物质光谱的混合,混合光谱对应的向量是纯物质向量的向量和,存在于各纯物质向量张成的子空间内,与该子空间的夹角为零;先将物质定性仪器测量单元测量到的待定性混合光谱向量,在物质定性仪器的数据信息处理单元中计算其与已知的多个标准样品光谱构成的子空间夹角,通过排列、筛选,判断出符合夹角小于含有最少标准样品数目的子空间,若该子空间与待定性混合光谱向量所处的子空间严格重合,该子空间内所包含的标准样品组成即为待定性混合光谱所含的物质成分组成,从而实现待定性混合光谱中所包含的各种物质的定性识别,识别结果作为物质定性仪器的分析结果输出;其具体步骤如下(参见图1):

S1:通过物质定性仪器——光谱仪的测量单元测量待定性混合光谱S,调用光谱仪存储单元预存储的含有n种已知光谱的标准样品光谱数据库L ,所述的n种已知光谱分别为:丙二醇、乙二醇、乙醇、甲醇和正丁醇拉曼光谱;

S2:在物质定性仪器的数据信息处理单元中用插值法统一测量所得的待定性混合光谱S及标准样品光谱数据库L的数据,即是将物质定性仪器测量单元输出的光谱响应值插值到与标准图谱具有相同的波长或波数刻度;

S3:计算待定性混合光谱S与标准样品光谱数据库L之间的子空间夹角θ;

S4:判断子空间夹角θ是否大于设定值A,如果是,则进入步骤S5;如果否,则进入步骤S6; 

S5:判定为待定性混合光谱S中包含了标准样品光谱数据库L以外的物质,需扩充标准样品光谱数据库L才能完成判断,操作结束;

S6:判定为待定性混合光谱S所包含的物质完全存在于标准样品光谱数据库L内,并取i=n,进入步骤S7;

S7:将标准样品光谱数据库L中的第i种光谱依次移出;

S8:再计算待定性混合光谱S与标准样品光谱数据库L之间的子空间夹角θ;

S9:再次判断子空间夹角θ是否大于设定值A,如果子空间夹角变大,超出设定值A,则进入步骤S10;如果子空间夹角θ未大于设定值A,则直接进入步骤S12;

S10:判定为待定性混合光谱S中含有标准样品光谱数据库L被移出的第i种光谱物质,并将该光谱在标准样品光谱数据库L中的序号记录在数组I中;

S11:将被移出的第i种光谱物质再移回标准样品光谱数据库L,然后再循环执行步骤S7顺序移出下一种光谱,即i=i-1,直至标准样品光谱数据库L中的所有光谱均被执行操作;

S12:判定为待定性混合光谱S中未含有标准样品光谱数据库L被移出的物质,然后再循环执行步骤S7顺序移出下一光谱,即i=i-1;

S13:判断标准样品光谱数据库L中的所有光谱是否被执行操作,即判断i是否等于0,如果否,则循环执行步骤S7操作,直至标准样品光谱数据库L中的所有光谱均被执行操作;如果是,则进入步骤S14;

S14:读取数组I中记录的序号,在标准样品光谱数据库L中找出对应的物质,该物质即为待定性混合光谱S中所包含的物质(参见附表一),即混合物实际由乙醇、乙二醇、丙二醇按体积比5:4:1构成;将识别结果输出到光谱仪的分析结果显示单元,完成定性;

上述各步骤中所述的设定值A为0.08弧度。

在上述步骤S2中,所述的插值法为已知技术,这里不再作详细说明。

在上述步骤S3和 S8中,所述子空间夹角的计算过程也为已知技术,其主要内容如下(参见图3,以向量对平面的夹角为例):

向量α和平面B的夹角为α在B上的垂直投影与α的夹角,即∠COH,通过求取CH可得到该角的正弦值;

在B上建立直角坐标OE⊥OD,将α投影到OD得OG,那么 α-OG=CG;再将CG投影到OE得到OF或GH,那么CH=CG-GH。

其中,多维空间夹角的算法步骤如下(参见图4):

S301:将子空间B用奇异值分解为正交描述;

S302:得到与其维数相等的n个正交向量{b1,…,bi,…,bn};

S303:将向量α定义为被投影的初始向量α1;

S304:将所有的向量的模量调整为1;

S305:从i=1开始;

S306:将被投影向量αi投影到其中一个正交向量bi上,用αi减去投影值,得到下一个被投影向量αi+1,即αi+1=αi-bi(bi’αi);

S307:重复步骤S306进行下一个向量投影;

S308:直到所有的正交向量都完成投影计算,即i>n;

S309:得到α与B子空间夹角的正弦值αn/α1,反正弦即可计算出该子空间夹角θ。

作为本实施例一的一种变换,所述的设定值A根据仪器的实际噪声强度设定,一般取0.05~0.1弧度。

作为本实施例一的又一种变换,所述的标准样品光谱数据库L不限于仅含有丙二醇、乙二醇、乙醇、甲醇、正丁醇光谱的数据库,而是根据实际需要包含有其余物质光谱和其他类型光谱的数据库,例如:红外、近红外、拉曼、紫外等多种类型的分子光谱。

 在本实施例一中,本发明还将待定性混合光谱S即混合物直接与纯物质图谱比对(参见图5~图9),在图5中,实线为甲醇波形,虚线为混合物波形;图6中,实线为乙醇波形,虚线为混合物波形;图7中,实线为乙二醇波形,虚线为混合物波形;图8中,实线为丙二醇波形,虚线为混合物波形;图9中,实线为正丁醇波形,虚线为混合物波形;

由上述图5~图9可以看出,混合物与乙醇的各个响应峰位置基本对应,因此可以判断出混合物中含有乙醇;而混合物与乙二醇相比,各个特征可以大致对应,但最大响应峰向后迁移,不能断定乙二醇存在;混合物与丙二醇的对应关系很差,无法判断是否含有丙二醇,因此特征峰响应判断的方法不适于判断混合物所含物质的定性。

而采用本发明的方法进行判断,在子空间夹角最小的集合中一定包含了混合物中的所有物质;当子空间未能包含混合物中所有物质时,夹角会出现陡升;而子空间包含混合物所有物质的同时又包含其他物质时,不会导致空间夹角的明显变化。所以空间角最小的集合中元素最少的子集就是本问题的解,即混合物中包含了:乙醇、乙二醇和丙二醇(见附表一)。

 

附表一:混合物拉曼光谱与纯物质图谱的不同组合构成的子空间的夹角

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号