首页> 中国专利> 一种中药质量追溯中化学指纹图谱转化为二维码的方法

一种中药质量追溯中化学指纹图谱转化为二维码的方法

摘要

本发明公开了一种中药质量追溯中化学指纹图谱转化为二维码的方法,仪器检测后导出的数据文件,统一转换为相同以xls结尾的Excel格式文件;读取数据文件内容,去噪处理,去除各类不需要的数据,对吸光度列取整;寻找所有的特征点集合;对时间列保留小数点1位,以时间列为基准进行数据去重;获取处理后的最终特征点数据集;将最后的数据集转换为二维码。本发明解决了中药化学指纹图谱信息信息量大的难题,通过这种算法,能将中药指纹图谱成功的转换为二维码,弥补了国内外的空白。

著录项

  • 公开/公告号CN104376355A

    专利类型发明专利

  • 公开/公告日2015-02-25

    原文格式PDF

  • 申请/专利权人 李西文;

    申请/专利号CN201410660433.X

  • 申请日2014-11-19

  • 分类号G06K19/06(20060101);

  • 代理机构

  • 代理人

  • 地址 100700 北京市东城区东直门内南小街16号

  • 入库时间 2023-12-17 04:10:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-08-31

    授权

    授权

  • 2016-06-29

    实质审查的生效 IPC(主分类):G06K19/06 申请日:20141119

    实质审查的生效

  • 2015-02-25

    公开

    公开

说明书

技术领域

本发明属于中药指纹图谱技术领域,具体地说,涉及一种中药质量追溯中化学指纹图谱转化为二维码的方法。

背景技术

从中药原材料的生产到成药的销售是一个多环节且复杂的过程,如何确保中药生产全程质量的“安全、有效、稳定、可控”是疾病预防和治疗成功的关键。目前中药生产和流通等各环节的质量检测相对独立,质量信息不能相互共享,导致监管盲点的出现。如何进行中药质量的全程追溯,跟踪中药质量检测信息,已成为目前中药质量追溯的一个亟待解决的难题。

化学指纹图谱是一种综合的,可量化的检定手段,它主要建立在化学成分系统研究的基础上,用于评价中药材以及中药制剂半成品质量的真实性、优良性和稳定性,是目前中药质量检测的主要手段。2010年版《中国药典》收载了多种现代分析技术,药典二部中含量测定或效价测定采用了专属性更强的液相色谱法,它不仅是一种中药质量控制模式和技术,更发展成为一种采用各种指纹图来进行中药理论(复杂系统)和新药开发的研究体系和研究模式。但化学指纹图谱在实践应用中,尤其是质量追溯过程中,存在诸多限制:一、化学指纹图谱为图片格式,数据容量大,信息压缩难度大,难以输出进行批量信息管理;二、化学指纹图谱不能通过扫描直接获取所包含的质量信息,难以在中药不同生产和流通环节之间进行信息的共享和管理。

条码技术是物流管理现代化的重要技术手段,因其可以快速准确的对流通信息进行数字化提取并批量管理,近年来在制造业和零售业得到了广泛的推广应用。DNA条码技术是采用一段标准的DNA序列进行物种鉴定,已经得到了分类专家的广泛认可,在中药真伪鉴别上应用越来越广泛,并被中国药典收载,作为中药检测手段之一。但DNA分子序列不能通过直接扫描自动识别,打印输出的尺寸大,不方便把DNA条形码应用于流通管理,一些学者进而对如何转换DNA序列为二维码进行了相关研究,现已成功应用在中药材真伪鉴定中。同时,国际上一些专家也提出把指纹图谱转换为二维码应用于身份识别。

由于中药化学指纹图谱信息采集量大,远远超过正常的二维码能够承载的容量,因此中药化学指纹图谱是否能够转换为二维码一直是一个亟待解决的问题。如果化学指纹图谱可以转化为二维码,则可以通过扫描获得中药质量信息,大大方便了中药质量追溯的标准化管理。二维码,又称二维条码,是用某种特定的几何图形按一定规律在平面分布的黑白相间的图形来记录数据符号信息。二维码利用构成计算机内部逻辑基础的“0”、“1”比特流的概念,使用若干个与二进制相对应的几何形体来表示文字数值信息。二维码种类非常多,分为堆叠式二维码和矩阵式两大类。在目前几十种二维码中,常用的码制有:Data Matrix、Aztec Code、QR Code、Vericode、PDF 417,PDF417Truncated、Codablock F、Code One,除此之外,还有Vericode条码、CP条码、Codablock F条码、田字码、Ultracode条码、汉信码、Aztec条码、Code 49、Code 16K等。

由于中药化学指纹图谱的存储数据基本上为数字字符,通过对通用的Data Matrix、AztecCode、QR Code、Vericode、PDF 417,PDF417 Truncated、Codablock F、Code One进一步分析比较发现,这8种二维码类型中最适合存储数字字符是以下三种:QR Code,Data Matrix和PDF 417。表1是这三种二维码的比较情况。从表中我们可以发现:QR Code无论从数字字符的存储容量、读取速度、读取方向以及遵循的国际标准等各方面的能力都超过其它二维码编码类型,是最适合用于中药化学指纹图谱数据的存储。这一技术的突破对建立中药质量的全程追溯和监督具有革命性的创新意义。

尽管QR Code最适合用于中药化学指纹图谱的承载,但由于中药化学指纹图谱信息量大,正常超过200k,所以尽管中药化学指纹图谱和分子序列及指纹图谱具有相似的矢量特征,但到目前为止尚未有中药化学指纹图谱转换为二维码的研究报道。

发明内容

为了克服现有技术中存在的缺陷,本发明提出了一种中药质量追溯中化学指纹图谱转化为二维码的方法,解决了中药化学指纹图谱信息量大难以进行标准化管理的难题,通过此种算法,能将中药化学指纹图谱成功的转换为二维码,弥补了国内外的空白。其技术方案如下:

一种中药质量追溯中化学指纹图谱转化为二维码的方法,包括以下步骤:

步骤1.高效液相色谱设备检测后导出的数据文件,如DIF、TXT、CSV等,统一转换为相同以xls结尾的Excel格式文件;

步骤2.读取数据文件内容,去噪处理。去除各类不需要的数据,如时间和吸光度为负数的数据,对吸光度列取整;

步骤3.寻找所有的特征点集合;

步骤4.对时间列保留小数点1位,以时间列为基准进行数据去重;

步骤5.获取处理后的最终特征点数据集;

步骤6.将最后的数据集转换为二维码。

进一步优选,步骤3中所述寻找所有的特征点集合具体步骤为:

步骤1.读取全部的化学指纹图谱数据转成二维数据ps,初始化用于保存特征点集合的哈希表hash,设置参数i等于0,二维数组ps总长度为len;

步骤2.开始循环读取每一个二维数组ps中的数据,以三个点为基本单位进行比较,判断当前的数据点是否到了最后一个处理点,如果不是,则继续处理,如果是,则退出;

步骤3.如果当前数据点是合理的处理点,则判断该点是否符合下面两种情况之一:

1)该点的y值大于前一个点的y值同时也大于等于后一个点y值;

2)该点的y值小于前一个点的y值同时也小于等于后一个点y值。

如果符合上面的条件则被认为是一个特征点,而被记录到哈希表hash中;

步骤4.循环处理,一直到全部的二维数据ps处理完毕;

步骤5.得到最终特征点哈希表数据集合。

本发明的有益效果为:本发明解决了中药指纹图谱信息信息量大的难题,通过这种算法,能将中药指纹图谱成功的转换为二维码,弥补了国内外的空白。

附图说明

图1为本发明中药指纹图谱转换为可用于质量追溯二维码的方法的流程示意图;

图2为本发明寻找所有的特征点集合的算法流程示意图;

图3为淫羊藿0303样本;

图4为淫羊藿0525样本;

图5为肉苁蓉235样本;

图6为牡丹皮270样本;

图7为淫羊藿0303样本转换成的二维码;

图8为淫羊藿0525样本转换成的二维码;

图9为肉苁蓉235样本转换成的二维码;

图10为牡丹皮270样本转换成的二维码。

具体实施方式

下面结合附图和具体实施方式对本发明的技术方案作进一步详细地说明。

本发明方案主要涉及到两个方面,一个是数据处理过程;另外一个是寻找特征点算法。

数据处理过程:首先通过高效液相色谱法获得中药化学指纹图谱数据,一般数据量非常大,因此需要进行数据的前期处理,参照图1,一种中药质量追溯中化学指纹图谱转化为二维码的方法,包括以下步骤:

步骤1.仪器检测后的导出的数据文件,如DIF、TXT、CSV等,统一转换为相同以xls结尾的Excel格式文件;

步骤2.读取数据文件内容,去噪处理。去除各类不需要的数据,如时间和吸光度为负数的数据,对吸光度列取整;

步骤3.寻找所有的特征点集合;

步骤4.对时间列保留小数点1位,以时间列为基准进行数据去重;

步骤5.获取处理后的最终特征点数据集;

步骤6.将最后的数据集转换为二维码。

寻找特征值算法:数据处理过程中关键的处理过程是第3步,寻找中药化学指纹图谱的特征点集合,计算机的算法说明如图2所示。步骤3中所述寻找所有的特征点集合具体步骤为:

步骤1.读取全部的指纹图谱数据转成二维数据ps,初始化用于保存特征点集合的哈希表hash,设置参数i等于0,二维数组ps总长度为len;

步骤2.开始循环读取每一个二维数组ps中的数据,以三个点为基本单位进行比较,判断当前的数据点是否到了最后一个处理点,如果不是,则继续处理,如果是,则退出;

步骤3.如果当前数据点是合理的处理点,则判断该点是否符合下面两种情况之一:

1)该点的y值大于前一个点的y值同时也大于等于后一个点y值;

2)该点的y值小于前一个点的y值同时也小于等于后一个点y值。

如果符合上面的条件则被认为是一个特征点,而被记录到哈希表hash中;

步骤4.循环处理,一直到全部的二维数据ps处理完毕;

步骤5.得到最终特征点哈希表数据集合。

通过该算法对中药化学指纹图谱数据集合进行处理,保留了原来中药化学指纹图谱的关键特征点数据集,大大缩小了数据量,为二维码的生成创造了条件。

实施例

通过对抽样选取不同类型16个中药化学指纹图谱测试数据进行分析发现,没有经过筛选的图谱数据文件大约为几百Kb之间,大大超过了现存的二维条码的容量。而经过我们的数据过程处理后,数据量发生了很大的变化,以下是数据在处理的过程中发生的变化表,参见表1。

表1 数据筛选处理过程中数据串长度与点数的变化表

以上数据筛选过程使用Ruby语言编程,经过筛选后的数据字符串长度范围为713~2323,压缩后的字符串长度相比原始数据字符串长度压缩率为0.23%~0.64%,数据点范围为110~337,压缩后的数据点数量相比原始数据点数量压缩率为1.12%~2.99%。

当数据经过以上数据筛选工作完毕后,筛选后的数据点转换为字符串,字符串最终转换为QR CODE。以下给出了4种不同中药材指纹图谱的筛选前、筛选后以及最后的中药化学指纹图谱的二维码,如图3-10所示。

由以上的实验结果可以看到,处理前的中药化学指纹图谱曲线与处理后的曲线吻合度非常高,图谱中主要的出峰数以及出峰延时基本一致,筛选后的数据可以顺利转换为二维码。

以上所述,仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换均落入本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号