首页> 中国专利> 一种基于量子模糊信息的数据分类系统及方法

一种基于量子模糊信息的数据分类系统及方法

摘要

本发明提供了一种基于量子模糊信息的数据分类系统及方法,系统包括:量子模糊化输入模块设置为将问题域中的模糊元素量子化后传递给改进模糊支持向量机分类模块;改进模糊支持向量机分类模块设置为利用改进的量子化模糊支持向量机对量子化模糊元素进行分类,并将分类结果传递给输出模块;输出模块将量子化的分类结果解码后转化为可识别内容显示;改进的量子化模糊支持向量机是将二次规划问题转化为线性方程组求解问题,并进行量子化处理的模糊支持向量机。本申请以直觉模糊集刻画不确定性问题,客观、准确、全面地反应不确定性问题中各对象的所蕴含的信息,利用量子计算在处理复杂性和不确定性问题上的高效率优势,准确、快速的处理相关问题。

著录项

  • 公开/公告号CN112686328A

    专利类型发明专利

  • 公开/公告日2021-04-20

    原文格式PDF

  • 申请/专利权人 成都信息工程大学;

    申请/专利号CN202110012519.1

  • 申请日2021-01-06

  • 分类号G06K9/62(20060101);

  • 代理机构51238 成都玖和知识产权代理事务所(普通合伙);

  • 代理人胡琳梅;王海权

  • 地址 610225 四川省成都市西南航空港经济开发区学府路一段24号

  • 入库时间 2023-06-19 10:41:48

说明书

技术领域

本发明属于大数据处理技术领域,尤其涉及一种基于量子模糊信息的数据分类系统及方法。

背景技术

随着各领域的数据量爆炸式地增长,经典信息处理技术与量子信息处理技术得到了很大的发展和广泛的应用。人们通过发现和利用大数据中隐含的有价值的数据和信息,极大地方便了生活、工作、学习和科研等方面,但同时也引发了很多问题。一方面,由于大数据具有结构复杂、规模大、种类多、流动速度快等特点,向传统计算理论与技术提出了很多挑战,在描述不确定性、不精确性和信息不完全的复杂问题时,现有的计算模型论难以胜任;另一方面,针对大数据的挖掘与分析,传统计算机已经无法适应任务处理的需要,寻找新的方法来处理这些任务就十分迫切。当前,为了进一步满足大数据及其应用快速发展的需要,如何精确刻画并高效处理不确定性数据的问题就显得十分重要。

1983年,保加利亚学者阿塔诺索吾(K.T.Atanassov)教授提出了直觉模糊集理论,利用三个标度(即隶属度、非隶属度与犹豫度)来刻画不确定性问题,能够更细腻、全面地描述客观现象的自然属性。

随着量子技术的发展,量子计算不再局限于对经典数据的处理,通过利用量子计算超强的并行计算能力、指数级存储容量等特征,可以更快处理大量的数据,提高机器学习对数据的处理能力,在处理复杂问题上具有巨大的优势。但现有技术在将大数据所具有的复杂性和不确定性问题进行定量、准确地描述,并将模糊化的数学描述量子化,以量子态作为信息处理单元方面的工作并不多也不深入。因此,寻求一种既能反映大数据所具有的复杂性和不确定性问题,又能符合量子计算的运算规律以及量子态特有的表示形式,同时还能直观、定量、准确地描述大数据所具有不确定性问题的数学建模方法,就成了本领域亟待解决的重要问题和最有前景的研究方向。

支持向量机是一种简单高效的机器学习方法,特别是在分类问题上有良好的分类效果和合理的误差界。使用支持向量机进行大数据的分类分析,成为近年来大数据处理的有效方法。支持向量机分为线性支持向量机和非线性支持向量机。分类速度上,线性支持向量机的处理速度明显快于非线性支持向量机:分类效果上,由于引入了核函数,非线性支持向量机拥有更好的分类效果。然而,支持向量机也存在一定的问题。其训练过程需要很多计算资源的支撑,比如足够的内存、足够的CPU处理速度等。然而,当数据量增长到一定级别时,单机上的内存和CPU速度往往不能够满足支持向量机的要求。因此,将支持向量机量子化以使其能够运行在量子计算机上就能够解决现有计算资源不能满足要求的问题。但本领域对该方向的研究少之又少。进一步的是,支持向量机运行时所依赖的分类超平面二次规划问题并不能直接被量子化并被量子计算机计算,因此,找到一种能够将其转化为量子形式可解的算法是本领域的痛点。

发明内容

针对现有技术存在的问题,本发明提供基于量子模糊信息将直觉模糊集理论和量子计算交叉融合,利用直觉模糊集理论刻画不确定性问题,将不确定性问题模糊化,结合量子计算在处理复杂性和不确定性问题上的高效率,将模糊信息量子化;以量子态作为信息处理单元,将传统支持向量机改进为量子化的模糊支持向量机,并将分类超平面二次规划问题转化为量子计算机能够处理的线性方程组问题,提供了一种客观、高效、准确的不确定性问题分类系方法,为研究量子模糊机器学习算法奠定理论基础。

为完成发明目的,本发明采用的技术方案是:

一种基于量子模糊信息的数据分类系统,包括量子模糊化输入模块、改进模糊支持向量机分类模块和输出模块;

所述量子模糊化输入模块设置为将问题域中的模糊元素量子化后传递给所述改进模糊支持向量机分类模块;

所述改进模糊支持向量机分类模块设置为利用改进的量子化模糊支持向量机对量子化模糊元素进行分类,并将分类结果传递给输出模块;

所述输出模块将量子化的分类结果解码后转化为可识别内容显示;

所述改进的量子化模糊支持向量机是将二次规划问题转化为线性方程组求解问题,并进行量子化处理的模糊支持向量机。

在一些较优的实施例中,所述量子模糊化输入模块包括模糊化单元和量子化单元;

所述模糊化单元设置为将输入的模糊元素x

所述量子化单元设置为将直觉模糊集A中所有元素在满足量子态归一化的条件下,加载到量子态上,得到量子直觉模糊集;其中,量子化的模糊元素x

在一些较优的实施例中,所述改进模糊支持向量机分类模块包括:量子模糊集编码单元、分类函数设计单元和改进模糊支持向量机单元;

所述量子模糊集编码单元设置为接收量子直觉模糊集,设定模糊训练集 D={

所述分类函数设计单元设置为根据所述模糊训练集|D>中的样本,构造基于距离的最优分类函数及其隶属度函数;

所述改进模糊支持向量机单元设置为将传统二次规划问题转化为线性方程组求解问题,载入所述隶属度函数,利用所述模糊训练集|D>中的样本完成训练,并将分类结果输出到所述输出模块。

在一些较优的实施例中,所述改进模糊支持向量机还包括使用量子交换门求解的核函数。

在一些较优的实施例中,所述将二次规划问题转化为线性方程组求解问题的方法为:

引入拉格朗日函数求解二次规划问题的决策函数,引入最小二乘法将决策函数转换为线性方程组:

在一些较优的实施例中,包括以下步骤:

步骤S1.将问题域中的元素模糊化,将模糊信息量子化,得到直觉模糊集 A={

步骤S2.将所述直觉模糊集A编码为量子模糊训练集,其中,量子化的模糊元素x

步骤S3.构造基于距离的隶属度函数;

步骤S4.构造改进模糊支持向量机,将传统二次规划问题转化为线性方程组求解问题,载入所述最优分类函数及其隶属度函数,利用所述量子模糊训练集中的样本完成训练;

步骤S5.利用训练好的改进模糊支持向量机对量子化模糊元素进行分类。

在一些较优的实施例中,步骤S2所述将直觉模糊集A编码为量子模糊训练集的具体方法为:

设定模糊训练集D={

在一些较优的实施例中,步骤S3包括:

步骤S301.将所有模糊元素x

步骤S302.将量子模糊元素代入最优分类函数及其隶属度函数,可得:

在一些较优的实施例中,步骤S4所述将传统二次规划问题转化为线性方程组求解问题,具体包括:

步骤S401.将支持向量机的最优超平面问题转化为二次规划问题,然后构造拉格朗日函数,求解得到二次规划问题的对偶问题,此时的决策函数为:

步骤S402.引入最小二乘法将决策函数转换为线性方程组:

本发明与现有的技术相比,其有益的特点是:

1、将直觉模糊集理论和量子计算交叉融合,高效、准确地描述大数据所具有复杂性和不确定性问题;

2、以直觉模糊集刻画不确定性问题,客观、准确、全面地反应不确定性问题中各对象的所蕴含的信息,然后以量子态作为信息处理单元,将不确定性问题域中的信息元素转换为可进行量子计算的量子模糊信息,可以利用量子计算在处理复杂性和不确定性问题上的高效率优势,准确、快速的处理相关问题;

3、基于量子计算理论构建量子化模糊支持向量机,将二次规划问题转化为线性方程组求解问题,并进行量子化处理,使支持向量机能够在量子计算机上运行。

附图说明

图1是本发明一种实施例中的系统结构图;

图2是本发明另一种实施例中的方法流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

实施例1

如图1所示,本实施例提供了一种基于量子模糊信息的数据分类系统,包括:量子模糊化输入模块、改进模糊支持向量机分类模块和输出模块;

所述量子模糊化输入模块设置为将问题域中的模糊元素量子化后传递给所述改进模糊支持向量机分类模块。

应当理解的是,在处理问题域中各元素的不确定性问题时,现有技术可以分为三大类:以概率为主的推理理论;以可信度为主的证据理论;以可能性为主的可能性理论;以及以隶属度为主的模糊集理论。本发明采用模糊集理论来处理问题域中的不确定性元素。

本领域的技术人员可以知晓,将不确定性元素进行模糊化的关键在于寻找不确定性的模糊度量,当下确定模糊度量的方式也有很多,例如信任度量、似乎可能性度量、概率度量、必要性度量和可能性度量等方法。在确定了模糊度量之后就可以将其进行量子化。应当理解的是,本实施例并不限定模糊度量的具体设定方法。对模糊度量进行量子化的理论基础在于:量子化的所有元素均须满足量子态归一化的条件。在此条件下,可以根据所选取的度量标准不同而有不同的量子化方法,本发明不作进一步的限定。

所述改进模糊支持向量机分类模块设置为利用改进的量子化模糊支持向量机对量子化模糊元素进行分类,并将分类结果传递给输出模块。

支持向量机(SupportVectorMachine,简称SVM)是一种基于统计学习理论的模式识别方法,它结构简单,且具有全局最优性和较好的泛化能力,是大数据处理和人工智能领域中求解模式识别和分类问题的有效工具。模糊支持向量机(FussySupportVectorMachine,简称 FSVM)是针对支持向量机推广到多类分类时存在的一些混分和漏分样本的问题,引入模糊因子以提高分类精度的一种向量机,其特点在于:给每个样本都赋一个模糊隶属度值,这样不同的样本对决策函数的学习有不同的贡献,以减小外部的影响。其核心在于:寻找一个能最大化分类间隔的分类超平面w·x

其中,对向量机进行量子化处理的关键在于构建适应于量子化计算方式的最优分类函数并进行量子化求解。

所述输出模块将量子化的分类结果解码后转化为可识别内容显示。

本领域的技术人员应当知晓,量子结果的解码方式有很多,并且现有技术中关于量子解码器的研究有很多,其具体的解码方式是另一个研究课题,本申请不作进一步限定和说明。

实施例2

如图2所示,本实施例是在上述实施例1的基础上展开的,在本实施例中,给出了上述系统进行数据分类的具体方法。

步骤S1.将问题域中的元素模糊化,将模糊信息量子化,得到直觉模糊集 A={

应当理解的是,由于本申请选择了以隶属度为主的模糊集理论,因此问题域元素进行模糊化的方法为构建问题域元素的直觉模糊集。

步骤S2.将所述直觉模糊集A编码为量子模糊训练集,其中,量子化的模糊元素x

步骤S3.构造基于距离的最优分类函数及其隶属度函数。

本领域的技术人员应当知晓,在进行模糊处理的过程中,隶属度函数需要客观准确的反映问题域中元素存在的不确定性,不同的隶属度函数会对算法的处理结果以及算法实现的难易程度产生不同的影响。构造隶属度函数的方法众多,但是现有技术对于隶属度函数的确立还没有一个可遵循的一般性原则,常用方法有:基于S型函数的隶属度设计、基于样本紧密度的隶属度函数设计、基于模糊C均值聚类算法的隶属度函数设计。在对实际情况进行处理时,通常需要针对具体问题根据经验来确定合理的隶属度函数。一般情况下,隶属度大小的基本确定原则是依据样本所在类中的相对重要性,或对所在类贡献的大小来确定的。在本实施例中,考虑采用距离来衡量元素对所在类贡献大小的依据,该方法将元素的隶属度看作是特征空间中元素与其所在类中心之间距离的线性函数,样本离类中心越近,隶属度越大,反之则越小。

步骤S4.构造改进模糊支持向量机,将传统二次规划问题转化为线性方程组求解问题,载入所述最优分类函数及其隶属度函数,利用所述量子模糊训练集中的样本完成训练。

步骤S5.利用训练好的改进模糊支持向量机对量子化模糊元素进行分类。

实施例3

本实施例是在上述实施例1的基础上展开的,在本实施例中,给出了量子模糊化输入模块的具体组成部分及原理。

所述量子模糊化输入模块包括模糊化单元和量子化单元;

所述模糊化单元设置为将输入的模糊元素x

所述量子化单元设置为将直觉模糊集A中所有元素在满足量子态归一化的条件下,加载到量子态上,得到量子直觉模糊集;其中,量子化的模糊元素x

实施例4

本实施例是在上述实施例1的基础上展开的,在本实施例中,给出了改进模糊支持向量机分类模块的具体组成部分及原理。

所述改进模糊支持向量机分类模块包括:量子模糊集编码单元、分类函数设计单元和改进模糊支持向量机单元;

所述量子模糊集编码单元设置为接收量子直觉模糊集,设定模糊训练集 D={

应当理解的,上述训练集是按经典两分类问题(y

模糊正类:问题域元素属于正类的隶属度大于属于负类的隶属度为;

模糊负类:问题域元素属于负类的隶属度大于属于正类的隶属度;

居中:问题域元素属于正类隶属度等于属于负类隶属度。

进一步的是,特征向量在量子概率幅上的编码方式有很多,例如计算基编码法:待编码的数据必须是经典离散数据,每一个经典的数据点x映射到量子比特的计算基态上。概率幅编码法:待编码的数据是整型数据类型、浮点型数据等连续数据,将标准化的输入数据加载到量子态的概率幅上。张量积编码法:待编码的数据点是连续型数据类型,将输入数据的每一个特征编码到单个量子比特的概率幅上。除了上述的编码方案,还有应用于连续变量量子计算机的squeezing编码、displacement编码以及Hamiltonian编码;Hamiltonian编码将信息编码到量子系统演化的Hamiltonian量。本领域的技术人员可以结合具体的问题来选择合适的编码方案,本申请不作进一步的限定。

所述分类函数设计单元设置为根据所述模糊训练集|D>中的样本,构造基于距离的最优分类函数及其隶属度函数;

所述改进模糊支持向量机单元设置为将传统二次规划问题转化为线性方程组求解问题,载入所述最优分类函数及其隶属度函数,利用所述模糊训练集|D>中的样本完成训练,并将分类结果输出到所述输出模块。

在另一些较优的实施例中,所述改进模糊支持向量机还包括使用量子交换门求解的核函数。

实施例5

本实施例是在上述实施例4的基础上展开的,在本实施例中,给出了制备量子态的模糊训练集的一种较优方法,包括:

设定模糊训练集D={

至此,得到了量子模糊元素的具体表示,本领域技术人员可以据此制备量子态的模糊训练集。

为了进一步的加强本领域技术人员对制备模糊训练集的理解,本实施例还给出了一种较优的实施方式,包括:

设定训练集的量子态为:

其中,

其中,

实施例6

本实施例是在上述实施例4的基础上展开的,在本实施例中,给出了一种将二次规划问题转化为线性方程组求解问题的较优方法,包括:

引入拉格朗日函数求解二次规划问题的决策函数,引入最小二乘法将决策函数转换为线性方程组:

实施例7

本实施例是在上述实施例5的基础上展开的,在本实施例中,给出了构造基于距离的最优分类函数及其隶属度函数的一种较优方法,包括:

步骤S301.步骤S301.将所有模糊元素x

步骤S302.将量子模糊元素代入最优分类函数及其隶属度函数,可得:

实施例8

本实施例是在上述实施例6和7的基础上展开的,在本实施例中,给出了一种求解所述向量机中的线性方程组的具体方法,对解算过程进行指数级加速,从而降低了支持向量机的计算复杂度,该方法具体包括:

步骤S401.由实施例6中得到的线性方程组

步骤S402.将F进行归一化,

步骤S403.利用Lie乘积公式将F指数化得:

步骤S404.将核函数K归一化可得:

步骤S405.|y>可以展开为具有相应特征值的

步骤S406.线性方程组的解

应当认识到,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器 (ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号