首页> 中国专利> 用于光谱仪的自动化模型训练装置和自动化模型训练方法

用于光谱仪的自动化模型训练装置和自动化模型训练方法

摘要

本发明提供一种用于光谱仪的自动化模型训练方法,其中透过一处理器以执行模型训练方法,并且模型训练方法包括:取得光谱资料;从一个或多个前处理模型选出至少一前处理模型;从一个或多个机器学习模型选出第一机器学习模型;建立对应于至少一前处理模型和第一机器学习模型的管线;以及根据光谱资料以及管线训练对应于管线的识别模型。本发明还提供一种模型训练装置和光谱仪。本发明提供的模型训练装置以及模型训练方法以快速地建立最佳的识别模型,并且使识别模型用于不同的光谱仪。

著录项

  • 公开/公告号CN112633307A

    专利类型发明专利

  • 公开/公告日2021-04-09

    原文格式PDF

  • 申请/专利权人 中强光电股份有限公司;

    申请/专利号CN201910949149.7

  • 发明设计人 王峰;黄彦钧;

    申请日2019-10-08

  • 分类号G06K9/62(20060101);G06N20/00(20190101);G01J3/28(20060101);

  • 代理机构72002 永新专利商标代理有限公司;

  • 代理人蔡洪贵

  • 地址 中国台湾新竹科学工业园区

  • 入库时间 2023-06-19 10:32:14

说明书

技术领域

本发明是有关于一种光谱仪的技术,且特别是有关于一种用于光谱仪的自动化模型训练装置和自动化模型训练方法以及一种光谱仪。

背景技术

光谱仪的应用依赖于用于检测光谱特征的识别模型的优劣,而不同应用所对应的光谱特征也不相同。因此,光谱仪的每一应用都需要由专家来建立对应的识别模型。专家需要反复地尝试多种前处理模型、机器学习模型及超参数(hyperp arameter)的组合,才能产生适合的识别模型,且所产生的识别模型还不一定是最佳的。

另一方面,多个光谱仪之间经常存在差异,且进行光谱测量时,测量结果容易受散射光光程影响。因此,相同的识别模型往往不用于不同的光谱仪,使用者需要分别针对不同的光谱仪进行识别模型的训练或校正。如此,厂商不仅无法大量地生产光谱仪,还需要耗费相当多的成本以维护众多的识别模型。

发明内容

有鉴于此,本发明提供一种用于光谱仪的自动化模型训练装置和自动化模型训练方法以及一种光谱仪以快速地建立最佳的识别模型,并且使识别模型用于不同的光谱仪。

本发明的其他目的和优点可以从本发明所揭露的技术特征中得到进一步的了解。

为达到上述之一或部分或全部目的或是其他目的,本发明的自动化模型训练方法用于光谱仪,其中透过一处理器以执行自动化模型训练方法,并且自动化模型训练方法包括:取得光谱资料;从一个或多个前处理模型选出至少一前处理模型;从一个或多个机器学习模型选出第一机器学习模型;建立对应于至少一前处理模型和第一机器学习模型的管线;以及根据光谱资料以及管线训练对应于管线的识别模型,其中训练模块根据光谱资料优化管线的超参数以训练识别模型。

为达到上述之一或部分或全部目的或是其他目的,本发明的光谱仪具有上述的自动化模型训练方法产生的识别模型。

为达到上述之一或部分或全部目的或是其他目的,本发明的自动化模型训练装置用于光谱仪,并且包括收发器、处理器以及储存媒体。收发器取得光谱资料。储存媒体储存多个模块。处理器耦接至收发器以及储存媒体,并且存取及执行多个模块,其中多个模块包括前处理模块、机器学习模块以及训练模块。前处理模块储存一或多个前处理模型。机器学习模块储存一个或多个机器学习模型。训练模块从一个或多个前处理模型选出至少一前处理模型,从一个或多个机器学习模型选出第一机器学习模型,建立对应于至少一前处理模型和第一机器学习模型的管线,并且根据光谱资料以及管线训练对应于管线的识别模型,其中训练模块根据光谱资料优化管线的超参数以训练识别模型。

为达到上述之一或部分或全部目的或是其他目的,本发明的光谱仪具有上述的自动化模型训练装置产生的识别模型。

基于上述,本发明的自动化模型训练装置和自动化模型训练方法能有效率地产生用于检测光谱资料的识别模型。

为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详细说明如下。

附图说明

图1根据本发明的实施例绘示一种用于光谱仪的自动化模型训练装置的示意图。

图2根据本发明的实施例绘示使用自动化模型训练装置训练识别模型的示意图。

图3根据本发明的实施例绘示一种用于光谱仪的自动化模型训练方法的流程图。

具体实施方式

为了使本发明的内容可以被更容易明了,以下特举实施例作为本发明确实能够据以实施的范例。另外,凡可能之处,在附图及实施方式中使用相同标号的元件/构件/步骤,代表相同或类似部件。有关本发明的前述及其他技术内容、特点与功效,在以下配合参考附图之一较佳实施例的详细说明中,将可清楚的呈现。以下实施例中所提到的方向用语,例如:上、下、左、右、前或后等,仅是参考附图的方向。因此,使用的方向用语是用来说明并非用来限制本发明。

图1根据本发明的实施例绘示一种用于光谱仪的自动化模型训练装置10的示意图。自动化模型训练装置10用以从各个的前处理演算法、机器学习演算法以及超参数的组合之中,自动地挑选出针对特定光谱特征的最佳组合,以产生用于检测该特定光谱特征的识别模型。自动化模型训练装置10包括处理器100、储存媒体200以及收发器300。

处理器100例如是中央处理单元(central processing unit,CPU),或是其他可编程的一般用途或特殊用途的微控制单元(micro control unit,MCU)、微处理器(microprocessor)、数字信号处理器(digital signal processor,DSP)、可编程控制器、特殊应用集成电路(application specific integrated circuit,ASIC)、图形处理器(graphics processing unit,GPU)、算数逻辑单元(arithmetic logic unit,ALU)、复杂可编程逻辑装置(complex programmable logic device,CPLD)、现场可编程逻辑闸阵列(field programmable gate array,FPGA)或其他类似元件或上述元件的组合。处理器100耦接储存媒体200以及收发器300,处理器100可存取及执行储存于储存媒体200中的多个模块,以实施自动化模型训练装置10的功能。

储存媒体200例如是任何型态的固定式或可移动式的随机存取存储器(randomaccess memory,RAM)、只读存储器(read-only memory,ROM)、快闪存储器(flash memory)、硬碟(hard disk drive,HDD)、固态硬碟(solid state drive,SSD)或类似元件或上述元件的组合,而用于储存可由处理器100执行的多个模块或各种应用程序。在本实施例中,储存媒体200可储存包括前处理模块201、机器学习模块202以及训练模块203等多个模块,其功能将于后续说明。

收发器300以无线或有线的方式传送及接收信号。收发器300还可以执行例如低噪声放大、阻抗匹配、混频、向上或向下频率转换、滤波、放大以及类似的操作。

图2根据本发明的实施例绘示使用自动化模型训练装置10训练识别模型26的示意图。请参照图1和图2,自动化模型训练装置10可通过收发器300取得(例如:自光谱仪)用于训练识别模型26的光谱资料21。储存媒体200中的训练模块203可根据光谱资料21来训练识别模型26。

具体来说,储存媒体200的前处理模块201可储存用于对光谱资料21进行前处理的多个前处理模型,其中所述多个前处理模型可关联于例如光滑(smooth)程序、小波(wavelet)程序、基线校正(baseline correction)程序、微分(differentiation)程序、标准化(standardization)程序或随机森林(Random Forest,RF)程序,本发明不限于此。

另一方面,储存媒体200的机器学习模块202可储存用于训练用于光谱资料21的识别模型的多个机器学习模型。机器学习模块202所储存的多个机器学习模型可包括例如回归模型以及分类模型,本发明不限于此。

训练模块203可以从前处理模块201中选出一个或多个前处理模型,并且对所述一个或多个前处理模型进行排序以产生包括至少一前处理模型的前处理模型组合23。举例来说,训练模块203可从前处理模块201中选出多个前处理模型以组合出如表1所示的前处理模型组合23的一种态样。由表1可知,依序由光滑程序、小波程序、基线校正程序、微分程序以及标准化程序所组成的态样#1可对应于最小的均方差(mean square error,MSE),故在本实施例中,态样#1为前处理模型组合23的最佳态样。本发明中,在其他实施例中,一个态样可包含不同数量的程序,本发明不局限于此。

表1

此外,训练模块203还可以从机器学习模块202中选出一机器学习模型24。训练模块203可将前处理模型组合23以及机器学习模型24组成管线22。管线22还包括对应于前处理模型组合23的超参数(或超参数组合)以及对应于机器学习模型24的超参数(或超参数组合)等资讯。具体而言,超参数(hyperparameters)组合可相关于使用者设定机器学习模型24调整资料变数,例如包含神经网路的层数、损失函数、卷积核心(convolution kernel)的大小、学习率等等。

在决定好管线22的组成之后,在步骤S21中,训练模块203可根据光谱资料21训练候选识别模型。具体来说,训练模块203可将光谱资料21分割为训练集合以及验证集合。训练模块203可利用训练集合来训练管线22,借以产生对应于管线22的候选识别模型。训练候选识别模型时所使用的损失函数例如关联于均方差(mean square error,MSE)演算法,但本发明不限于此。

而后,在步骤S22中,训练模块203可利用光谱资料21的验证集合来调整及优化对应于管线22的候选识别模型的超参数(或超参数集合)。训练模块203可根据例如网格式搜寻(Grid search)演算法、排列搜寻(permutation search)演算法、随机搜寻(randomsearching)演算法、贝氏最优化(Bayesian optimization)演算法、遗传演算法(geneticalgorithm)或强化学习(reinforcement learning)演算法等演算法来为候选识别模型决定出最佳超参数(或最佳超参数集合)。

在决定好最佳超参数后,在步骤S23中,训练模块203可根据对应于管线22的候选识别模型及其最佳超参数来判断管线22的表现。在取得管线22的表现后,训练模块203可决定是否选用对应于管线22的候选识别模型作为识别模型26,并且输出识别模型26。举例来说,训练模块203可基于候选识别模型的表现良好(例如:候选识别模型的损失函数的均方差小于一阈值)而决定输出候选识别模型以作为待使用者所使用的识别模型26。

或者,在步骤S23中,训练模块203可选择训练新的候选识别模型,并且从多个由训练模块203所训练的候选识别模型中,选出最佳的候选识别模型以作为识别模型26。在训练新的候选识别模型之前,训练模块203需要先产生新的管线22。举例来说,训练模块203可以根据前处理模块201中的多个前处理模型的至少其中之一来产生新的前处理模型组合23,并且根据机器学习模块202中的多个机器学习模型的其中之一来产生新的机器学习模型24。据此,训练模块203可利用新的前处理模型组合23以及新的机器学习模型24产生新的管线22。在训练模块203产生了分别对应于不同管线的多个候选识别模型后,训练模块203可响应于一特定候选识别模型的表现优于其他候选识别模型(例如:该特定候选识别模型的损失函数具有最小的值)而选择该特定候选识别模型作为识别模型26。

在一实施例中,训练模块203可根据例如网格式搜寻演算法、排列搜寻演算法、随机搜寻演算法、贝氏最优化演算法、遗传演算法或强化学习演算法等演算法来匹配新的前处理模型组合23以及新的机器学习模型24,借以产生新的管线22,从而根据新的管线22训练出识别模型26。由于管线22的组成具有多种不同的态样,故训练模块203可根据上述的演算法来快速地筛选出管线22的较佳组成,从而降低识别模型26的训练时间。

在另一实施例中,储存媒体200可储存对应于至少一管线的历史管线清单,其中历史管线清单记载了自动化模型训练装置10在过去曾经使用的管线的组成。训练模块203可从历史管线清单中选择出一历史管线来作为新的管线22,从而根据新的管线22训练出识别模型26。换句话说,历史管线清单可帮助训练模块203更快速地找出最佳的管线22。

图3根据本发明的实施例绘示一种用于光谱仪的自动化模型训练方法的流程图,其中所述自动化模型训练方法可由如图1所示的自动化模型训练装置10(或自动化模型训练装置10的处理器100)实施。在步骤S310,取得光谱资料。在步骤S320,从一个或多个前处理模型选出至少一前处理模型。在步骤S330,从一个或多个机器学习模型选出第一机器学习模型。在步骤S340,建立对应于至少一前处理模型和第一机器学习模型的管线。在步骤S350,根据光谱资料以及管线训练对应于管线的识别模型,其中训练模块根据光谱资料优化管线的超参数以训练识别模型。

具体来说,对应于识别模型26的该管线则表示为针对光谱资料21的最佳组合,其中该管线包含至少一前处理模型组合及其超参数(或超参数组合)以及机器学习模型及其超参数(或超参数组合)。在该管线的使用上,处理器100可再以特定的光谱资料对此管线进行训练,以获得特定的根据特定的光谱资料的识别模型。

综上所述,本发明能从众多的前处理演算法、机器学习演算法以及超参数的组合之中,自动地挑选出针对特定光谱特征的最佳组合,以产生用于检测该特定光谱特征的识别模型。专家将不再需要针对每一不同的光谱特征逐一建立对应的识别模型。

惟以上所述者,仅为本发明的较佳实施例而已,当不能以此限定本发明实施的范围,即凡是依本发明权利要求书及发明内容所作的简单的等效变化与修改,皆仍属本发明专利涵盖的范围内。另外本发明的任一实施例或权利要求不须达成本发明所揭露的全部目的或优点或特点。此外,摘要和发明名称仅是用来辅助专利文件检索之用,并非用来限制本发明的权利范围。此外,本说明书或权利要求书中提及的“第一”、“第二”等用语仅用以命名元件(element)的名称或区别不同实施例或范围,而并非用来限制元件数量上的上限或下限。

附图标记说明:

10:自动化模型训练装置

100:处理器

21:光谱资料

22:管线

23:前处理模型组合

24:机器学习模型

26:识别模型

200:储存媒体

201:前处理模块

202:机器学习模块

203:训练模块

300:收发器

S21、S22、S23、S310、S320、S330、S340、S350:步骤。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号