首页> 中国专利> 一种红外光谱建模工具包及其开发方法和应用

一种红外光谱建模工具包及其开发方法和应用

摘要

本发明涉及医药技术领域,具体公开了一种红外光谱建模工具包及其开发方法和应用。所述工具包包含光谱文件存取整合模块;预处理模块(谱图处理、目标物质浓度处理);波段优化模块;建模模块和模型评价模块。该工具包具有界面友好可视、模块清晰、简单明了、易于操作等优点,即便是没有建模经验的分析人员也很容易上手。

著录项

  • 公开/公告号CN105426588A

    专利类型发明专利

  • 公开/公告日2016-03-23

    原文格式PDF

  • 申请/专利权人 广东药学院;

    申请/专利号CN201510749717.0

  • 发明设计人 陈超;尹嵩杰;王淑美;梁生旺;

    申请日2015-11-05

  • 分类号G06F17/50(20060101);

  • 代理机构44102 广州粤高专利商标代理有限公司;

  • 代理人杨昕昕;邓义华

  • 地址 510006 广东省广州市大学城外环东路280号

  • 入库时间 2023-12-18 14:59:01

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-10-15

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F17/50 变更前: 变更后: 申请日:20151105

    专利权人的姓名或者名称、地址的变更

  • 2018-12-14

    授权

    授权

  • 2018-06-29

    著录事项变更 IPC(主分类):G06F17/50 变更前: 变更后: 申请日:20151105

    著录事项变更

  • 2016-04-20

    实质审查的生效 IPC(主分类):G06F17/50 申请日:20151105

    实质审查的生效

  • 2016-03-23

    公开

    公开

说明书

技术领域

本发明涉及医药技术领域,具体涉及一种红外光谱建模工具包及其开发方法和应用。

背景技术

红外光谱(infraredspectrum,IR)技术利用物质在红外光谱区的吸收快速测定物质组成及含量,能清晰、科学地给出物质的结构信息,具有样品处理简单、不消耗试剂、不产生污染、不破坏样品、分析速度快、可以同时测定多种成分等优点,是适用于复杂样品(如中药、生物制品)的原位、在线、实时定量分析的方法之一。

但是,中药等复杂体系的红外光谱信号由于受基线、背景、噪声、重叠峰等影响,难以通过简单的数据处理方法实现准确的定性和定量分析,而化学计量学为复杂体系的红外光谱分析与建模提供了技术支持。鉴于目前医药领域尚没有红外光谱建模工具包,以及相关研究人员一般不具有化学计量学工作背景,因此亟需开发一个简单、易上手、带有GUI界面的红外光谱建模工具包,从而可以大大减轻医药研究相关人员的工作量。

发明内容

本发明所要解决的技术问题是,为了克服现有技术中存在的上述问题,提供一种红外光谱建模工具包及其开发方法和应用。

本发明所要解决的上述技术问题,通过以下技术方案予以实现:

一种红外光谱建模工具包,包含:光谱文件存取整合模块;预处理模块(谱图处理、目标物质浓度处理);波段优化模块;建模模块和模型评价模块。

优选地,所述的光谱文件存取整合模块包含以下功能:读取dpt、xls等格式存储的光谱文件、保存处理或整合过的光谱、保存建模日志及结果。

优选地,所述的预处理模块包含谱图处理及目标物质浓度处理两个子模块;所述的谱图处理子模块包含归一化、平滑、求导、平均、剔除、基线校正以及傅里叶自退卷积功能;所述的目标物质浓度处理子模块包括归一化和取对数功能。

优选地,所述的波段优化模块包含无信息变量消除(UVE)、多模型共识无信息变量消除(cUVE)、反向区间偏最小二乘(BiPLS)、随机森林(RF)和遗传算法(GA)功能。

优选地,所述的建模模块包含偏最小二乘(PLS)、多模型共识偏最小二乘(cPLS)、支持向量机(SVM)、最小二乘支持向量机(LS-SVM)、径向基人工神经网络(RBF-ANN)、误差反向传播人工神经网络(BP-ANN)和随机森林(RF)功能。

优选地,所述的模型评价模块包括相关系数(R)、预测均方根误差(RMSEP)、平均相对误差(MRE)和预测准确率(Acc)的指标的计算功能。

一种红外光谱建模工具包的开发方法,它是基于Matlab平台集成开发,具体包含如下步骤:

S1.编写GUI主界面:在光谱文件存取整合模块、预处理模块(谱图处理、目标物质浓度处理)、波段优化模块、建模模块和模型评价模块模块之间用菜单形式连接,主界面设置显示运行日志的文本框,以提醒和帮助用户进行操作。

S2.编写光谱文件存取整合模块:利用uigetfile()、load()和xlsread()函数实现读取及保存dpt、xls存储格式的光谱文件;利用uigetdir()函数实现一次性批量读取大量光谱,同时实现保存运行日志和结果功能;自编函数实现批量保存为单个xls文件的功能;

S3.编写预处理模块:归一化用mapminmax()函数以及normaliz()函数实现,平滑使用smooth()函数实现,求导使用ChemoAC_Toolbox的基于Savitsky-Golay算法的deriv()函数实现,平均光谱使用自编的avspec()函数实现,剔除使用pdist()函数实现,基线校正、傅里叶自退卷积均使用自编的函数实现,目标物质浓度取对数处理使用log10()函数实现;

S4.编写波段优化模块:无信息变量消除(UVE)和多模型共识无信息变量消除(cUVE)均使用ChemoAC_Toolbox的plsuve()函数实现,反向区间偏最小二乘(BiPLS)使用iToolbox的bipls()函数实现,随机森林(RF)使用RFMex/Standalone的regRF_train()函数实现,遗传算法(GA)则使用crtbp()、ranking()、select()、recombin()、mut()、reins()函数实现;

S5.编写建模模块:首先编写分配训练集和测试集的函数splitdata(),主要使用crossvalind()函数实现;然后编写各建模方法的GUI界面,可以选择输入各种参数;最后编写各建模算法;偏最小二乘(PLS)和多模型共识偏最小二乘(cPLS)用plsregress()和ChemoAC_Toolbox的plscv()函数实现,支持向量机(SVM)主要用svmtrain()、svmpredict()函数实现,最小二乘支持向量机(LS-SVM)用LS-SVMLab的tunelssvm()、trainlssvm()、simlssvm()函数实现,径向基人工神经网络(RBF-ANN)用newrb()、sim()等函数实现,误差反向传播人工神经网络(BP-ANN)用newff()、sim()函数实现,随机森林(RF)使用RFMex/Standalone的regRF_train()、regRF_predict()函数实现;

S6.编写模型评价模块:以一个自编的函数performance()实现;其中相关系数(R)用corrcoef()实现,预测均方根误差(RMSEP)和平均相对误差(MRE)、预测准确率(Acc)根据公式自编实现。

优选地,所述模块间相互保持低耦合,模块内保持高内聚;各模块采用在主界面上以菜单形式实现,各菜单的回调函数即是子模块;如果子模块有可选参数,则加上一个.fig界面,以实现参数输入。

优选地,所述工具包调用setappdata(0,'name',val)和getappdata(0,'name')来传递参数。

所述的红外光谱建模工具包在药物开发中的红外光谱预处理、选波段、建模、评价或根据红外光谱定性或定量工作中的应用。

有益效果:本工具包是基于Matlab平台集成开发的,为医药领域广大研究人员快速、简便地进行红外光谱建模工作提供了帮助;实施例中以中药材枸杞中铜元素含量的建模工作为应用实例,简单展示了本工具包的使用过程,可以看到该工具包基于软件工程思想,具有界面友好可视、模块清晰、简单明了、易于操作等优点,即便是没有建模经验的分析人员也很容易上手。

附图说明

图1为所述红外光谱建模工具包开发技术路线图。

图2为所述工具包主界面。

图3为点击“文件>批量打开原始光谱”后的路径选择界面图。

图4为批量打开原始光谱后的主界面图。

图5为求导过程的参数选择界面图。

图6为打开1D9S光谱图。

图7为读入浓度文件之后的图。

图8为biPLS参数选择界面图。

图9为使用biPLS选择完波段之后的图。

图10为PLS参数选择界面图。

具体实施方式

以下结合具体实施例来进一步解释本发明,但实施例对本发明不做任何形式的限定。

基于Matlab平台集成开发红外光谱建模工具包的方法如下:

S1.编写GUI主界面:在光谱文件存取整合模块、预处理模块(谱图处理、目标物质浓度处理)、波段优化模块、建模模块和模型评价模块模块之间用菜单形式连接,主界面设置显示运行日志的文本框,以提醒和帮助用户进行操作。

S2.编写光谱文件存取整合模块:利用uigetfile()、load()和xlsread()函数实现读取及保存dpt、xls存储格式的光谱文件;利用uigetdir()函数实现一次性批量读取大量光谱,同时实现保存运行日志和结果功能;自编函数实现批量保存为单个xls文件的功能;

S3.编写预处理模块:归一化用mapminmax()函数以及normaliz()函数实现,平滑使用smooth()函数实现,求导使用ChemoAC_Toolbox的基于Savitsky-Golay算法的deriv()函数实现,平均光谱使用自编的avspec()函数实现,剔除使用pdist()函数实现,基线校正、傅里叶自退卷积均使用自编的函数实现,目标物质浓度取对数处理使用log10()函数实现;

S4.编写波段优化模块:无信息变量消除(UVE)和多模型共识无信息变量消除(cUVE)均使用ChemoAC_Toolbox的plsuve()函数实现,反向区间偏最小二乘(BiPLS)使用iToolbox的bipls()函数实现,随机森林(RF)使用RFMex/Standalone的regRF_train()函数实现,遗传算法(GA)则使用crtbp()、ranking()、select()、recombin()、mut()、reins()函数实现;

S5.编写建模模块:首先编写分配训练集和测试集的函数splitdata(),主要使用crossvalind()函数实现;然后编写各建模方法的GUI界面,可以选择输入各种参数;最后编写各建模算法;偏最小二乘(PLS)和多模型共识偏最小二乘(cPLS)用plsregress()和ChemoAC_Toolbox的plscv()函数实现,支持向量机(SVM)主要用svmtrain()、svmpredict()函数实现,最小二乘支持向量机(LS-SVM)用LS-SVMLab的tunelssvm()、trainlssvm()、simlssvm()函数实现,径向基人工神经网络(RBF-ANN)用newrb()、sim()等函数实现,误差反向传播人工神经网络(BP-ANN)用newff()、sim()函数实现,随机森林(RF)使用RFMex/Standalone的regRF_train()、regRF_predict()函数实现;

S6.编写模型评价模块:以一个自编的函数performance()实现;其中相关系数(R)用corrcoef()实现,预测均方根误差(RMSEP)和平均相对误差(MRE)、预测准确率(Acc)根据公式自编实现;

所述模块间相互保持低耦合,模块内保持高内聚;各模块采用在主界面上以菜单形式实现,各菜单的回调函数即是子模块;如果子模块有可选参数,则加上一个.fig界面,以实现参数输入;所述工具包调用setappdata(0,'name',val)和getappdata(0,'name')来传递参数。

实施例1

本实施例以中药材枸杞中铜元素的含量分析为例,展示本红外光谱建模工具包的简单使用方法。

首先,将枸杞经粉碎后采集的原始光谱在本发明所述的工具包中打开,如图2、图3和图4所示。

然后,点击“谱图处理>求导”,打开求导窗口,如图5所示。选择参数degree为1和Window为9,点击确定,作一阶导数九点平滑处理,之后将导数光谱进行保存,如图6所示。

点击“文件>读取浓度文件”,读取枸杞中目标物质铜元素的对应浓度(用参考方法ICP/MS测定的准确浓度),点击“浓度处理>取对数”,对读入的浓度数据作对数转换处理,如图7所示。

点击“波段优化>反向区间偏最小二乘”,打开biPLS波段优化的参数窗口(图8),使用默认参数22,可将光谱波段压缩到320个数据点(压缩率18%),如图9所示。

最后,点击“评价>偏最小二乘”,打开PLS建模窗口,如图10所示,设置好相应参数,如训练集与测试集的样本数分配比为3:1、PLS的主成分数为7,运行次数为5,点击“Calibrate”按钮,即可进行建模和评价,运行结束后各项评价指标会显示在命令行窗口,包括相关系数(R)、预测均方根误差(RMSEP)、平均相对误差(MRE)等,结果见表1。

表1PLS建模和评价结果

从本实施例的使用方法可以看到该工具包基于软件工程思想,具有界面友好可视、模块清晰、简单明了、易于操作等优点,即便是没有建模经验的分析人员也很容易上手。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号