首页>中文会议>工业技术>自动化技术与计算机技术>第六届中国Rough集与软计算学术研讨会(CRSSC'2006)
第六届中国Rough集与软计算学术研讨会(CRSSC'2006)

第六届中国Rough集与软计算学术研讨会(CRSSC'2006)

  • 召开年:2006
  • 召开地:浙江金华
  • 出版时间: 2006-10-30

主办单位:中国计算机学会;中国人工智能学会;浙江师范大学

会议文集:第六届中国Rough集与软计算学术研讨会(CRSSC'2006)

会议论文

热门论文

全部论文

全选(0
  • 摘要:在数据挖掘的研究中,预测模型的研究是一个很重要的问题.而分类是预测的手段之一,因此分类方法的研究又是至关重要的.目前,国内外常用的分类方法有统计方法、机器学习方法、粗糙集方法、神经网络方法和遗传算法等.然而,这些方法却存在许多不足之处.例如,用神经网络方法分类的可解释性差;统计方法需要大量的先验知识而且得出的不是规则形式,不易让用户理解;用遗传算法进行分类,运行花费的时间长. 因此,人们希望分类器得到的是规则的形式,因为规则形式容易让客户理解,便于对结果分析,判断它是否合理,以便做出修改.那么进一步要求分类得出的规则预测准确率要高,规则的数目要少,规则的长度要尽量简短.同时,希望算法运行的时间效率能够进一步提高.本文简介Ant-Miner算法和基于快速蚁群算法的分类规则挖掘。
  • 摘要:计算决策表的属性约简是粗糙集理论的一个重要部分.在实际应用中,人们往往期望得到属性数最少的一个属性约简,即最小属性约简.Wong S.K.M及Ziarko.W已经证明了找出一个决策表的最小属性约简是NP-hard问题,因此,要设计出求最小属性约简的有效方法是比较困难的.目前提出的一些属性约简算法大都属于启发式的搜索算法,它们的优点是易于实现,且计算速度快,但求出的不一定是最小的属性约简.粒子群优化PSO算法[9]、免疫算法都是近年来发展起来的智能群体优化方法,可用于全局优化搜索,而且往往具有收敛速度比遗传算法快的优点.为此,本文把人工免疫系统的免疫调节机制用于二进制粒子群算法中粒子多样性的控制,并提出了一个基于免疫调节和粒子群优化的最小属性约简算法.该算法把免疫调节机制与二进制粒子群优化算法有机地结合在一起,有效地防止了算法陷于局部最优,提高了搜索最小属性约简的效率.对UCI数据表的实验结果说明了该方法的有效性及可行性。
  • 摘要:设计是一个复杂的过程,不管是建筑设计还是工程设计,所涉及到的参数都很多.在这其中,最复杂的是人的因素.在确定任务之后,通过抽象化,拟定功能结构,寻求适当的作用原理及其组合等,确定出基本求解途径,得出求解方案,这一部分设计工作叫做概念设计.概念设计是设计过程中一个非常重要的阶段.不但产品的创新设计主要在概念设计阶段,而且根据有关的统计资料表明,产品工本费的70%是在产品设计阶段决定的.同时,一旦概念设计被确定下来,产品设计的60%~70%也就被确定下来.尤其需要提及的是,即使详细设计再好,也难以弥补概念设计阶段所出现的缺陷.在设计问题中,常见的评价方法有两种,即人工评价和机器评价.目前机器评价应用并不广泛,主要是因为对设计的评价仍是一个复杂的问题,表现在量化上更是一个难以解决的问题.本文研究 小波网络的自构造算法和基于小波网络的概念设计评价。
  • 摘要:MIDI(Music Instrument Digital Interface)文件是一种描述语言,存放着各音轨所使用的乐器和播放内容.MIDI音乐播放器通过解释各种MIDI时间播放声音.MIDI技术的产生与发展,迅速渗透到音乐生活的各个领域,电影音乐制作、动画配乐、手机铃声、游戏音乐、原创编曲无疑离不开MIDI技术,在无形中,正逐渐颠覆着传统音乐的制作模式.同时MIDI广泛应用于基于内容的音乐检索,音乐驱动的运动编辑,音乐喷泉,娱乐机器人和基于音乐特征的舞美控制中.由于音乐中的主旋律是音乐的主体内容,在基于MIDI的计算机应用研究和音乐产品工业化应用实践中,主旋律的自动提取是其中的前提性工作. 对于单轨MIDI音乐,不需要进行主旋律提取,但是对于多音轨MIDI音乐,主旋律存在于某一个音轨中,必须进行识别工作.对于具有伴奏的多声部音乐,一般人都能区别出主旋律和伴奏部分.因此,识别主旋律是人们认知复杂音乐的基础,但计算机对主旋律的识别要比人耳迟钝得多.本文研究主音轨与伴奏音轨的音程特征及基于音程统计法和改进BP神经网络的MIDI音乐主旋律识别算法。
  • 摘要:一个系统(控制系统,信息传输系统,通讯系统),人们期望这个系统遵守设定规律而运动,期望系统稳定.事实上,系统外部(或内部)的一些不被人们事先认识的规律,经常入侵(或叠加)到系统中(如通讯系统中的干扰规律对系统的入侵),使得系统的规律呈现紊乱.这些不被人们事先认识的规律,通常把它称作"干扰规律".这个事实,在控制系统,通讯系统,风险投资系统中遇到的最多.如何识别这些"干扰规律"对系统的入侵与攻击,是本文的讨论主题. 本文的讨论是在函数单向S-粗集(function one direction singular rough sets)上展开的,为了便于讨论,把函数单向S-粗集[1,2]引入到2中。
  • 摘要:机器学习的实现方法大致分为三类,分别为经典的(参数)统计方法、经验非线性方法和统计学习理论(Statistical learning theory),它是研究小样本统计估计和预测的理论,以VC维来描述机器的学习能力,并发展出了一系列关于统计学习的一致性,收敛速度,泛化性能等重要的结论.而SVM(support vector machine)是在统计学习理论(SLT)的基础上发展起来的一种机器学习方法,并且适合有限样本(小样本)问题分类问题,并且在很大程度上解决了传统方法中存在的问题.SVM对指纹的分类提供了有效的检索机制,Shesha Shah对指纹的分类作了较为深入的研究,提出了一种HMM与SVM相结合的新型的判决方法,提出了基于SVM的两级指纹分类研究,通过对粗细两级指纹的分类器的构造,取得了较好的泛化能力.本文利用SVM理论,构造了组合多类SVM和单类SVM两类多值分类器对5类指纹进行分类,对其产生的试验结果进行了分析,其效果还是可以接受的。
  • 摘要:身份识别是模式识别的一个重要方面.传统的身份识别以单一生物特征为识别依据,如利用语音信号的说话人识别系统;采用指纹信息的指纹识别系统;对人脸图像进行识别的人脸识别系统等.由于传感器,特征提取和匹配算法等局限性使得单一生物特征往往不能保证正确的识别.为解决这一困难,多生物特征数据融合识别技术在这一领域引起了研究者们的广泛关注.Diekmann等人根据人脸、唇部运动以及声音的方法,在决策层利用简单的投票算法,判断了单个分类器做出的决策是否和其他两个分类器一致.Brunelli和Falabigna利用说话人识别和人脸识别的方法,基于量测级对两种不同的声音分类器和三种不同的人脸分类器的结果进行归一化处理,再用几何平均的方法进行融合.Lin和Jain使用人脸和指纹构造的身份识别系统达到了很高的识别率[7].多生物特征识别可以达到很高的识别率,但是这种方法往往在识别过程中要匹配多个生物特征,在大量数据中进行身份识别的系统开销大,识别缓慢.所以,本文提出一种基于人脸和语音的两阶段身份识别方法.这种方法把身份识别分成两个阶段,在第一阶段,简单快速的人脸识别子系统将数据库中的待识身份中进行粗选,得出一个备选集.在第二阶段,声纹识别子系统结合第一阶段人脸识别的结果在备选集中进行辨识,得到最后的结果.这种方法不仅达到了多生物特征的高识别率,同时也降低了系统识别的开销,能够较好地满足实际应用的需要。
  • 摘要:Agent特别是多agent系统(multi-agent system,MAS)作为人工智能学科中一个基本领域,最近若干年来引起人们的广泛兴趣和重视.agent作为解决某一实际问题的智能代理,其功能是"单一"的,但通过群体agent之间的通信和协同以及相应的冲突分析与处理,MAS就可以解决非常复杂的问题,完成相当困难的任务.在这里,智能并不只是体现在个体agent上,更重要的是体现在群体即MAS的协同工作与冲突消解机制当中.由于agent本身的自治性和局部视图限制,以及系统架构的松散耦合性,还由于涉及到的资源和信息的有限性,agent协作过程中难以避免冲突,冲突分析与消解就成为MAS协作中的基本课题,本文研究 基于agent群体冲突模型及分析。
  • 摘要:入侵检测技术作为网络安全防护的重要组成部分,已成为网络安全的核心技术之一.入侵检测系统(IDS:Intrusion Detection System)通过对网络和系统记录的日志文件的分析来发现非法的入侵行为以及合法用户的滥用行为.本文研究 入侵检测体系结构和基于多Agent协作的分布式入侵检测系统体系结构。
  • 摘要:免疫入侵检测系统是利用人工免疫系统的模型和算法来优化入侵检测系统,其研究发展方兴未艾.目前提出的模型只应用了部分免疫系统的原理和机制,并且主要停留在理论研究和探索阶段,在工程上的应用还欠缺很多.为了有效地解决上述问题,建立一个健壮、灵活和具有良好伸展性的入侵检测系统,本文提出了一个基于免疫机制的Multi-Agent入侵检测系统模型。
  • 摘要:入侵检测作为一种积极主动的安全防护技术,它可以识别入侵者、识别入侵行为、检测和监视已经成功的入侵,并进行入侵响应,是解决网络安全问题的重要组成部分. 本文主要讨论分布式人侵检测系统中报警信息的融合模型和融合算法,并进行进一步的分析。
  • 摘要:Web服务的出现使得Web从一个纯粹提供信息检索和反馈的基础构件转变成一个在涉及到人类各个领域的可以配置、访问、使用软件代理的平台.随着Web服务的不断增多,要想找到符合自己需求的Web服务越来越难.UDDI作为Web服务的注册中心,是一个被广泛接受的技术,但是其基于关键字的查询机制并不能得到一个让人满意的查询结果.更不能实现Web服务自动发布、自动发现、自动选择、自动调用、自动执行、自动监控等一系列问题.要解决上述问题,就需要使信息能被机器"理解",有利于搜索引擎进行复杂的信息查询,有利于软件代理的知识理解和推理.Tim Berners-Lee于2001年正式提出了语义万维网(Semantic Web),语义万维网可以帮助计算机和人类更好地协同工作.由于语义的引入,作为集成语义Web技术和Web服务技术而产生的语义Web服务使我们有望构建自动的Web服务发现、匹配及执行系统.在面对大量的同类型Web服务可供选择的情况下,用户可以免除手工寻找、选择Web服务这种效率低下的工作,而由程序根据用户自己的状态、要求及Web服务的参数实现自动寻找、选择Web服务并自动执行优选出来的Web服务.本文建立了一个语义Web服务发现框架,在传统的UDDI的基础上做一定的改进,实现基于语义的Web服务查询机制。
  • 摘要:城市交通系统是随机性大、影响因素众多的复杂系统,尤其是中国城市的交通,车辆种类繁多,兼有自行车干扰,更是如此.中国的自行车的保有量和出行量都是非常巨大的,是我国混合交通的主要组成之一.要研究我国的混合交通流,必须把以自行车为主的低速交通流和机动车流的研究结合起来,把车流在路段上和交叉口的通行结合起来.而要研究自行车的交通流及其在交叉口的通行问题,首要就是建立自行车交通流模型.现有的自行车模型对自行车的行驶特性分析不够充分,没有考虑到横向速度和纵向速度的关系[3],并且,采用周期性边界条件只能分析稳定的自行车流,对密度变化的自行车流无能为力. 针对混合交通流自行车建模存在不足,通过分析自行车的行驶特性,本文采用二维元胞自动机对自行车进行建模,并采用边界开放条件对模型准确性进行了验证.仿真结果表明,其密度-速度、密度-流量特性均符合理论或经验数值.该模型的建立为城域道路自行车道渠化和信号灯相位设置的研究奠定了基础。
  • 摘要:自从网格被提出来,许多资源组织与管理模型、一系列系统原型(诸如Globus、Legion、Unicore和一些与网格计算紧密相关的理论与技术(诸如语义Web、Web服务)相继出现.网格的动态、分布特性和密集型计算能力与语义、服务能力地融合,涌现了许多网格的概念(诸如语义网格、计算网格、数据网格、信息网格、知识网格)和网格提供的服务的概念(诸如计算服务、数据服务、信息服务、知识服务、语义服务).在这些网格的研究应用问题中,从计算服务、数据服务角度给出了网格的许多资源管理模型;从信息服务、知识服务角度给出了网格的资源空间模型;从计算服务、数据服务、信息服务、知识服务角度给出了资源的语义模型.本文从粗糙概念分析理论角度,对这些网格和网格提供的服务的概念与关系、以及资源管理策略,进行了分析、归纳、研究,提出了粗糙概念格和粗糙形式概念Trie树的网格资源组织与管理方式.并用形式概念分析理论,研究了网格资源粗糙概念格的补生成算法、网格资源粗糙概念Trie树的构造、以及外延Trie树和内涵Trie树的生成算法、资源与服务检索算法。
  • 摘要:在日常生活中经常遇到一类业务处理问题,例如"顾客投诉"问题.这类业务处理过程在日常生活中具有一定的普遍性.为建立和管理好这类系统,需要一整套完整的建模、分析的理论和方法.Petri网侧重于系统的物理结构描述和性质分析,有对结构与行为的统一考虑,对系统的表达能力强,并已形成严格的体系.本文就以Petri网作为上述业务过程处理系统的建模、分析工具.考虑到一次性建模的复杂性,用Petri网先建立系统的粗略模型,然后再对其进行精细化得到系统的精确模型。
  • 摘要:自动调制识别是通信信号处理及相关领域中一个前沿专题,尤其在空中交通管制、电子对抗等方面得到广泛应用.数字通信的快速发展形成了多种通信体制并存的局面,而且这些通信体制的调制方式和接入技术各不相同,给多体制间的通信互联带来了很大的障碍.自动调制识别技术是构成基于软件无线电的通用接收机和智能调制解调器的重要技术基础,在多体制通信互联和软件无线电方面有着十分重要的应用. 近年来,在模式识别、信号处理、时间序列的预测等领域中,由于人工神经网络具有分布式存储和并行处理方式、自组织和自学习的功能以及很强的容错性和鲁棒性等优点,成为了应用极为广泛的模型.将神经网络应用于通信信号调制识别方面,已经有一些学者作了有益研究,但大部分都是基于BP网络建立的识别系统[4],而BP网络存在训练时间长、收敛速度慢且存在多个局部最小点等自身的缺陷,影响了识别的效果,很难做到实时处理.而自组织特征映射(SOFM)神经网络具有网络结构简单、自组织自学习能力强和学习速度快等优点,是目前分类效果比较好的一种神经网络模型,已经被应用到了多个领域.因此本文提出将SOFM神经网络应用到通信信号的自动调制识别中,以实际信号进行测试,取得了令人满意的结果。
  • 摘要:本文提出一种新的基于属性聚类的Rough集属性约简算法CLUBRAR.本算法首先把属性进行聚类,从而得到属性之间的关系的全局信息;然后,在这种全局信息的指导之下再进行局部求优.实验结果表明:与QuickReduct算法相比较,CLUBRAR算法可以有效地提高属性约简的质量.但算法中,聚类数目、频率阈值和依赖度等参数对属性约简结果的影响是研究中需要进一步讨论的问题。
  • 摘要:文[1~3]提出了奇异粗集的(F,-F)遗传及特性,揭露了系统中的"信息惯性".系统中任何一个新信息的增加将使得粗集的知识粒度有缩小的趋势,而任何一个旧信息的删除使得粗集的知识粒度有增大的趋势,由此文提出了遗传筛子原理和广义遗传筛子原理.本文在此基础上作了进一步讨论,将遗传颗粒看作考察对象,遗传知识属性集合的效用看作是使得旧信息向新信息过渡的遗传筛子,整个筛选过程是新旧信息变化对于知识粒度变化的影响过程,即遗传过程,同时也是一个知识的分离过程.高阶的遗传将进行多次知识分离,也就形成了广义遗传筛子.将广义遗传筛子分为多个遗传筛子进行考虑,从而得出了广义遗传筛子结构的不同,即,系统中新属性引进的先后次序不同,对知识颗粒的形成影响也不同.各个遗传筛子的筛选能力及它们之间的关系很大程度上决定了筛选过程中知识的分离.这对于在能够控制或预测属性变化的动态系统中,进行知识的分离和决策,提供了一定的理论支持。
  • 摘要:企业财务风险分析,是当前企业管理的前沿和热点问题.由于企业财务风险产生的原因复杂,种类繁多,某些因素可以度量,而有些因素却难以量化,因此很难科学计算与评价.这就要求建立有效的财务指标分析方法,及时发现企业中的问题并予以消除,从而实现企业的持续发展.因此,企业财务风险指标分析及企业财务风险预测已经成为企业财务管理的重要内容,属于当前研究的热点. 传统的企业财务风险分析,一般是利用历史数据,采用预警指标等级界限划分法、多元统计分析方法及比率法等.这些方法需要依赖历史样本和专家经验,预测知识的学习是间接的、低效的、缺乏动态的,指标的提取和对预测的结果也不够理想.因此需要应用其他的技术和分析方法来研究及提取影响企业财务风险预警指标.随着Rough集的出现,企业财务风险预警指标的分析已成为可能,并为企业财务风险预测提供了一个有效的手段。
  • 摘要:遥感影像融合是遥感应用中的重要环节之一,有利于增强多重数据分析能力,改善遥感信息提取的及时性和可靠性,有效地提高数据的使用率,为大规模遥感应用研究提供良好的基础.与此同时,随着遥感和地理信息系统技术的高速发展以及空间数据库的规模日益扩大,不同类型、分辨率、光谱特征的多源影像所包含信息的冗余性、不确定性更加突出,如果遍历所有的融合算法并进行比较分析无疑是不现实的.因此对多源信息进行精化处理与数据挖掘,并根据信息的特性选择最优化的融合算法,提高融合分析的快速性和准确性,具有更加现实的意义.本文研究 Rough Set知识化简与应用模型,基于MIBARK算法的多源图像决策级融合。
  • 摘要:集合理论为描述离散世界中各种事件提供了一个十分有用的基础,千差万别的事物都可以用集合论的方法加以描述和阐释.Pawlak提出的Rough集理论是在集合理论基础上发展起来在智能计算中使用的又一有力工具,特别在机器学习、知识获取、决策分析和决策支持系统等都有重大的应用. Rough集理论的主要优点是在数据分析时不需要任何关于数据的预备或附加信息,如统计概率或模糊集理论的隶属函数等.Rough集理论能处理知识不准确、不完善的问题,它的基本方法是确定性的.本文研究 基于Rough集理论的遗传算法编码及属性约简例子。
  • 摘要:20世纪80年代初,波兰数学家Z.Pawlak首先提出了粗糙集理论,其作为一种新的数学方法被用来处理各种不精确、不确定、不完备信息.粗糙集理论凭借自身的优点--不需要研究对象的任何先验或额外的预备信息得到了迅速发展.另一方面,贝叶斯数据分析是数据样的先验分布在经过了证据修订后形成的后验分布,目前被广泛地应用于各种智能化数据分析中.上述两种方法的结合对于决策规划起到了不错的效果。 本文以基本偏序关系为基础,运用以上两种方法构建了基于贝叶斯的偏序粗集模型,并进一步将其应用到生态学的食物网中。
  • 摘要:近年来,涌现出了许多防伪技术,特别是数字技术随着计算成本的不断降低,在过去的几十年中获得了广泛的研究,例如数字水印技术.虽然当今世界流行基于计算机的技术,但是许多传统的防伪技术仍然具有很大的价值.例如管理某些商品的标签以及追踪设备部件的钢印.目前验证这些标签和钢印基本上依靠受过良好培训的人员的眼睛.当前中国车管所通过比较车辆引擎上的钢印的拓印图像来验证车辆和管理车辆.由于车辆的数量巨大,这个过程的自动化能够提高验证效率,能够带来很大的社会和商业效益.在智能自动化方面目前已经有一些有益的尝试,但是很少能够在复杂多变的环境下良好工作。
  • 摘要:L.Zadeh开创了模糊集理论,引入模糊熵的概念,用来度量模糊集的模糊性测度.1982年,Pawlak[2]给出了粗糙集的概念.作为模糊集理论与粗糙集理论的结合,Dubios D和Prade H[3]于1990年给出了模糊粗糙集(FRSs)和粗糙模糊集的概念.本文提出了模糊粗糙集的一个几何表示,定义了模糊粗糙集的基数,利用模糊粗糙集的几何表示给出了模糊粗糙集的非概率熵测度,证明了这一测度可以表示为模糊粗糙集的基数的商。
  • 摘要:本文基于邻域和邻域关系的概念提出了一种实数空间的粗糙集模型.该模型以论域空间中任意对象的邻域形成论域空间的粒化,以下近似和上近似来逼近空间中的任一子集,从而实现了实数空间的粒度计算.进一步,我们展示了该模型在分类问题数值型特征选择中的应用.通过比较试验分析,发现可变精度邻域模型可以选择很少量的特征,但保持甚至显著提高分类精度。
  • 摘要:在经典集合理论中,对象与集合的关系是确定的,即非此即彼.而现实生活中存在大量的含混概念是亦此亦彼的,因而很难用经典的数学方法进行描述.因此,长期以来许多数学家和哲学家就致力于研究含混概念.Zadeh于1965年开创性地用隶属度来描述对象和集合之间的隶属程度,从而提出了模糊集理论.但模糊集理论中隶属函数的确定依赖于先验知识,因而在有些没有先验知识的情况下,该方法显得无能为力. 针对该问题,Pawlak于1982年提出用两个经典集合来描述含混概念,即上近似和下近似,这就是粗糙集理论的最初思想.该理论一经提出,就得到了很多研究者的关注和研究,由于粗糙集理论在处理不确定信息上的优越性,并且不需要领域先验知识,它已经被应用到各个领域,特别是在机器学习,数据挖掘和模式识别等领域。
  • 摘要:属性约简是粗糙集理论中重要的研究内容.目前,已提出了许多属性约简算法.常见的属性约简是利用区别矩阵来计算相对核,得到相对约简.如文的算法,这类算法可以得到决策表的所有可能的约简,但是逻辑公式化简的过程计算量很大.提出了启发式属性约简算法,这类算法的计算量相对较小,但是只能得到决策表的一个相对约简,且不一定是最小约简. 上述算法都是在整个论域上进行的,这使得每次进行划分运算时进行了大量的冗余运算,即在整个约简过程中仅仅考虑了对属性的增减,而没有考虑论域中论域的变化对约简效率的影响. 本文提出了一种新的决策表属性约简算法.该算法通过不断将一定属性集下决策表中协调的部分去除,把不协调的部分作为新的论域作进一步处理,逐步缩小参与属性约简的论域,在一定程度上降低了求取约简的计算量。
  • 摘要:属性约简是Rough集理论研究的核心内容之一.本文从信息的角度出发,结合现有的遗传算法,提出了一种在优化各种遗传参数的基础上改进属性约简算法,在加强局部搜索能力的同时保持了该算法全局寻优的特性.通过实验对比分析表明,该算法能够有效地对决策表进行约简。
  • 摘要:数据分析旨在获取有效知识,最精简的知识基最具有研究价值.为避免获取所有约简集需要的庞大计算量,但又能得到确定的最有价值的知识基,将Rough集理论的不可区分关系和保持分类特征不变的约简理论与结构数据的特征相结合,我们得到了实用的属性约简预分析算法,因此确定数据集不可区分关系最少需要的描述属性数p0,而由启发式约简结果获得的约简集所含的应有属性数pR,确定了在相对属性全组合来说极有限的范围里进行属性的有界全组合运算的约简算法,得到获得最小属性约简全集的一个可取途径.有关实验数据有待进一步的完成。
  • 摘要:自模糊集提出以来,许多的模糊推理方法被提出作为模糊环境下推理的数学工具.众所周知,模糊推理已成为了理论基础,以及设计模糊控制器的重要工具,并在工业某些领域应用中取得了成功,如智能控制.尽管如此,模糊逻辑的数学基础仍然有许多严重的问题需要解决,这导致了一些深入研究.其中的一个问题就是模糊蕴涵式的选择,因为蕴涵是任何逻辑系统里的主要连接,它对模糊逻辑应用的系统的运行强大的影响. Zadeh,Mamdani等人对模糊蕴涵式作了早期研究,对模糊蕴涵式的研究进展有.我们先从前人研究的结果找出一些规律,然后用其指导我们对模糊蕴涵式的继续研究. 论文第1节详细分析二值逻辑的蕴涵式,给出一种全新的二值逻辑蕴涵式真值表.第2节用卡诺图方法分别化简各种情况下的二值逻辑蕴涵式真值表.第3节分析扩展的二值逻辑关系式与目前已有的模糊蕴涵式的关系,然后提出两个不同的模糊蕴涵式.第4节介绍模糊推理,并用实例来验证我们提出的模糊蕴涵式的正确性与合理性。
  • 摘要:本文将模糊算法与免疫进化算法相结合,设计一种基于模糊免疫算法的二自由度PID控制器.仿真结果表明该控制器不仅具有良好的目标跟踪特性,而且具有良好的抗干扰特性,提高了二自由度PID控制器中的参数调节能力。
  • 摘要:随着Internet的快速发展,Web页面以指数级的速度膨胀,给信息的有效检索带来了严峻的挑战.目前已提出多种搜索方法来提高检索工具的智能性,以达到更高的查准率和查全率.主要的两种方法是:(1)信息分类方法(2)信息过滤方法. 目前数据挖掘中的很多技术已被广泛地应用于WEB信息检索中.如支持向量机(SVM)、神经网络、粗糙集等方法.自从Tim Berners-Lee提出语义Web以来便得到了广泛的应用.特别是Ontology作为语义Web中的一个要件,它不仅能对概念进行严格的定义而且还能定义概念之间丰富的关系.本文尝试首先利用Ontology自动学习技术从词-文档矩阵中抽象出概念的集合,然后再利用粒度计算的相关理论减小搜索的时间复杂度. 本文的组织结构是:首先对网页进行分类,然后再根据用户提出的查询问题进行切词,利用Ontology自动学习技术,形成概念,建立中文Ontology.最后采用商空间中的保真原理和保假原理进行搜索方式的改进,提出新的搜索算法。
  • 摘要:蛋白质结构预测是根据氨基酸序列预测相应蛋白质空间结构,是当前分子生物学首要解决的难题,并被列为21世纪生物学的首要任务.60年代初,Anfinsen就提出了他的著名论断:蛋白质特定的空间结构是由其氨基酸排列顺序决定的,而蛋白质的天然构象是能量最低的构象.从此,利用能量极小化方法预测蛋白质结构有了合理的热力学基础.然而,由于蛋白质是一个强柔性的大分子体系,其能量表面存在着极多的局部极小点,缺少一种有效的全局优化方法困扰着蛋白质结构研究的进展.为解决这一问题,人们从两方面进行努力:一是在保持精度的条件下,简化物理模型和数学模型;二是寻找适用于蛋白质结构预测的全局优化方法,这是科学家们长期努力研究的重要内容.本文研究 PBIL算法及其扩展和在蛋白质二级结构预测中的应用。
  • 摘要:空间数据挖掘和知识发现(Spatial Data Mining and Knowledge Discovery,简称SDMKD)是指从空间数据库中提取隐含的知识、空间关系或从海量、且纷繁复杂的空间数据中寻找其规律性、知识性的认识.由于空间数据的非结构化、多维度、多尺度等特征,SDMKD比一般的数据挖掘复杂,研究的兴起也较晚. 随着空间信息科学的发展,SDMKD在诸如地理信息系统等方面的应用越来越广泛,作为空间科学的重要分支之一,地理信息系统在很多应用中都需要求给定物体的RkNN.而现有RkNN算法一般都存在以下的不足:不支持3D空间;对k的值有限制;不支持数据库的动态更新;或者不能得到精确的结果.基于此,本文提出了一个利用已有先进的kNN算法,在3D空间内能够支持数据更新且适合任意k值的RkNN算法. kNN与RkNN的解决方法都取决于距离量度的选择,本文采用的是N维欧拉空间RN以及欧拉距离L.我们用D来表示距离量度,即:对于任意两个点p和q,它们之间的欧拉距离记为D(p,q)。
  • 摘要:聚类特点是输入空间的样本没有理想输出,因此它属于无监督模式识别问题.对于聚类问题,就是根据样本之间的某种相似度,将比较相近的样本自组织地聚集到一类.一般聚类的目标,就是使得类内距离最小和类间距离最大.其中分级聚类和k-均值聚类是两种的比较常用聚类方法.但此两种方法各有自己的优缺点.分级聚类精度高,但由于计算复杂度太大,不适合大规模样本的聚类.K-均值聚类计算复杂度较低,但是受初始聚类中心的选择影响较大,并且在假设同一类样本只有一个聚类中心聚类效果较好,如果有多个,则聚类效果不佳。本文研究分级聚类与k-均值核聚类相结合的聚类算法。
  • 摘要:高校在进行本科生毕业论文综合评价工作中,通常要组织一批专家或老师,对每个学生的论文情况按照指标进行打分,再综合得出该学生的论文成绩,并把它作为一条历史数据,录入数据库.因此,在学生毕业论文的综合评价中既存在历史经验数据(以下简称"历史数据"),又存在多个专家评分形式的数据(以下简称"专家数据").如何充分有效地利用这些数据,对于科学评价高校毕业论文的质量具有重要意义。本文研究基于VPRS和证据理论的综合评价方法。
  • 摘要:在大量的AI应用中,最常遇到的问题之一便是寻找从起点到目标点之间的最短路径.一般来说,路径的寻找是基于状态空间的,在AI中的最短路径的寻找中,常以启发式搜索算法为主. 启发式搜索就是在状态空间中的搜索过程中,对每一个搜索位置进行评估,以便得到最好的位置,再从这个位置进行搜索直到目标.这样可以节省大量无谓的搜索路径,提高效率.在启发式搜索中,对位置的估价是十分重要的,采用不同的估价会产生不同的效果. 本文研究基于二叉堆的A*寻径算法及其应用。
  • 摘要:数据挖掘是数据库研究、开发和应用最活跃的分支之一.分类(Classification)是一类重要的数据挖掘问题,它是一个从现有的带有类别的数据集中寻找同一类别数据的共同特性,并以此将它们进行区分的过程,它可以用于提取描述重要数据类的模型和预测未来的数据趋势.分类的方法主要有决策树,神经网络,粗糙集,遗传算法,贝叶斯分类等.本文研究BBP模型和基于感知器的数据挖掘分类方法。
  • 摘要:聚类就是将数据对象分组成为多个类或簇,在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大.聚类技术在数据挖掘、统计学、机器学习等领域都有广泛的应用.然而对高维数据聚类存在着"维数灾难"问题,并且许多对象只在某些属性上相似.为了解决这一问题,可采用子空间聚类(subspace clustering)将高维空间的数据投影到子空间中再进行聚类.本文探讨基于模式树的高维数据快速子空间聚类算法。
  • 摘要:虽然网页设计者一般将相关内容放在同一页面,但是网页通常包含如广告、导航栏、版权信息等与页面主题关系不大的信息,同时也可能包含多个主题.如果将整张网页作为最小不可分割的基本信息实体进行处理,会受到较多干扰;如果能对页面进行语义分割,识别出相关语义区域进行处理,可以提高网页信息获取的精度和效率.本文研究树编辑距离,Web页面语义区域划分和基于树编辑距离的页面语义区域识别。
  • 摘要:本文提出的主观信任表示方法,兼顾了主观信任的不确定性和模糊性,并基于云模型在信任的定性概念和定量表示之间架起了一座桥梁.把人类语言的软推理机制引入到主观信任的推荐计算中,使得主观信任推理灵活直观,很好地体现了人类的思维特征和习惯.另外CBYE具有较好的可操作性,容易把用户的满意度投票转换为信任云,因而可以方便地应用于电子商务系统中。
  • 摘要:许多流数据源,例如网络化(通信工程、入侵检测、传感器网络)和金融服务(套汇、金融监控)等都容易产生尖峰脉冲.尖峰脉冲出现时,最大负荷量将远远超过标准负载,这时提供一个全面的数据流监测系统来处理最大负荷通常是不切实际的.然而,在多数监测背景下,监测应用程序在高负荷突发时能顺利地履行其作用是最为关键的.这时就会产生这样一个问题:就是当数据到达的速率以不可预知的形式增加时,会出现资源短缺问题,这将导致在对数据处理的过程中产生一段等待时间.为了避免出现延迟的情况,数据流管理系统必须以一种可控制的方式卸除一些负载.因此,负载卸除可以这样定义:当对资源的需求超过系统能力时,从系统中撤销过量的负载,这种过程就是负载卸除.由于负载卸除是通过撤销数据来减少对资源的需求,它是以牺牲查询结果的准确度为代价的.负载卸除的主要目标就是:在一定的精确度内,使得这种牺牲代价达到最小.本文阐述了一些解决方案,并对它们的简洁草图进行了分析。 本文首先考察了Au-rora系统中的一种能按当前负载的需求动态地在查询计划中插人和删除撤销操作符。它具有两种类型的撤销:第一种类型以一种随机化的方式撤销一部分元组,第二种类型的撤销是基于元组内容的重要性。其负载卸除处理由三个基本的决策组成,即负载卸除的时间,地点及负载卸除的数量。本文对其有效的解决方案进行了分析,并进一步说明这些解决方案能够以响应品质中最小化的降级将系统恢复到有效的运行范围之内。
  • 摘要:在网络监测、点击流、电信呼叫记录等许多领域中,数据以流的形式出现.挖掘并分析数据流中的频繁项集是获得数据流中有用信息的一种方法.由于数据流具有无限性和连续性的特点,使得传统的挖掘方法难以适用.挖掘数据流中的频繁项集是当前数据挖掘研究领域的研究热点. 许多研究人员已经对数据流中的频繁模式挖掘进行了广泛的研究.本文利用count sketch数据结构提出了挖掘前k个最频繁的频繁项集的算法.提出了Lossy Counting算法挖掘数据流中的频繁1项集,并对频繁项集的挖掘给出了实践方法.利用Count-Min Sketch数据结构对数据流中数据项进行统计查询.提出了一种新的FP-DS算法.该算法采用分段思想,利用改进的FP-growth算法逐段重建FP树挖掘频繁项集.当数据流中的频繁项集增加较多时,算法的效率下降很大。
  • 摘要:本文针对算法FindFPOF中选定的关联规则挖掘算法的改进是有效的.在相同算法时间复杂度的情况下,能够比FindFPOF得到更多有意义的候选离群点.本文对算法FindFPOF的改进是针对其选择的关联规则挖掘算法进行的,当选择的关联规则算法不产生候选项目集的情况下,我们仍然可以在算法步骤中对某些项目集检测其支持度大小,这是下一步继续研究的内容。
  • 摘要:入侵检测是一种重要的网络安全技术.Denning在1987年提出了通用入侵检测模型,为入侵检测奠定了理论基础.随后发展出误用检测和异常检测两种检测技术.异常检测建立正常行为模型,以是否显著偏离正常模型为依据进行检测,能够发现未知攻击,是目前的研究热点. 传统的检测系统采用有监督的学习算法,需要带标记或完全正常的数据来训练获得正常行为模型.若标记错误,算法将失效.况且,要为训练数据收集到完全正常的数据是不可行的,因此研究无监督的入侵检测是必要的.本文研究自适应共振理论,克隆选择学说和基于ART和多克隆网络的入侵检测算法。
  • 摘要:针对不同的目标及应用领域,数据挖掘有多种不同的称谓,如:知识发现、信息检索、智能数据处理等.数据挖掘的一般步骤包括:问题域的界定、数据汇总、预处理、执行特定的挖掘算法、结果展示与知识评估.其中核心的工作是挖掘算法的执行.本文强调的是数据的聚类分析,即:寻找相似的数据项并对其进行类别划分.业已证明,人工神经网络是进行数据挖掘的行之有效的工具之一,特别是与数据分类和聚类有关的问题.神经网络的本质是其内在的基于样本驱动的自学习功能,它与基于假设的问题求解策略截然不同,对求解复杂的高维非线性映射问题提供了一条有效的途径.神经网络的又一特点是其对噪音数据及冲突数据的容错性及处理能力。
  • 摘要:方程求解问题是一个古老而重要的问题,解决科学技术和工程实践中遇到的数学问题,常常需要先解决高次代数方程或方程组的求解问题,有时还需要解超越方程或方程组.长久以来,人们就已经找出了许多求解方程的方法,常用的方法有:简单迭代法、牛顿法、割线法、延拓法、搜索法、梯度法、共轭方向法、变尺度法等等.这些传统的方程求解方法一般对方程都有较强的限制要求(如连续、可导),而且算法的收敛性和最终结果与初值的选取有较大的关系,一般都要求有相当精度的解的近似值作为初值.另外,由于算法缺乏通用性,针对一个具体的问题,人们需要有相当的知识去判断使用哪种方法较为合适.本文研究用于求解方程的PSO算法。
  • 摘要:自20世纪80年代,在Rumelhart和McCelland的一书中提出了误差逆传播算法(Error-Back-Propagation Algorithm),又称BP算法.由于BP网络具有中间隐含层,其误差逆传播算法有相应的学习规则可循,使得它对非线性模式具有较强识别能力,特别是其数学意义明确、步骤分明的特性,使其具有广泛的应用价值. 但BP神经网络并不完善,主要表现在:学习时间长,尤其在训练大规模的神经网络时;收敛速度慢,在单机环境下甚至不能确定它是否收敛.为减少网络训练时间,获得实时应用需要的时间,并行处理是很有必要的.本文研究并行训练计算方式存在的问题及基于梯度的并行神经网络模型。
  • 摘要:人工鱼群算法(AFSA,Artificial Fish-school Algorithm)是模仿鱼类行为提出的一种基于动物自治体的优化方法,是集群智能思想的一个具体应用,它的主要特点是不需要了解问题的特殊信息,只需要对问题进行优劣的比较,有着较快的收敛速度.文中给出的变参数人工鱼群算法(VPAFSA,Variable Parameter Artificial Fish-school Algorithm)是在人工鱼群算法基础上引入变参数,其目的是用以加快算法的收敛速度,提高所求问题结果的精度,然后将变参数人工鱼群算法用于求多项式的最大公因子,而传统的方法是用辗转相除法来求两个多项式的最大公因子,本质上辗转相除法其计算结构是一"串行"计算结构,当多项式次数较高时,辗转相除法计算量大,特别对于多项式系数是浮点型的多项式,所得到多项式的最大公因子精度低等.针对这些问题,文中利用人工鱼群算法的特点,将该算法用于近似求多项式的最大公因子.其求解思想是:首先是把求多项式的最大公因子问题转化成求多项式组的根,再把求多项式组的根转化成优化问题,最后,用变参数人工鱼群算法求得多项式的最大公因子。
  • 摘要:本文主要对遗传算法在测试用例最小化上的应用进行了研究,实现了用遗传算法建模实现测试用例最小化选择的功能,并对这种算法进行了改进,有效地缩减了选取测试用例集的花费时间,减少了回归测试成本.以上技术可应用于实际软件测试自动化中,但是克服各种编程语言间的差异,还有许多工作要做。
  • 摘要:从20世纪80年代以来,人脸识别是计算机视觉和模式识别领域中一个非常活跃的研究领域.由于其广泛的应用前景,已经得到了国内外众多研究人员的关注,到目前为止已经提出了各种不同的人脸识别算法.设计一个自动人脸识别系统一般分为两步:首先是人脸特征数据的提取和选择;第二是设计一个具有良好性能的识别器.这两个步骤中,人脸特征数据的提取和选择非常重要,因为提取的人脸特征数据直接影响后面识别器对人脸的识别结果.如果提取了不好的特征数据,就是选择具有最好性能的识别器也同样无法得到较好的识别效果.只有在具有较好的特征数据条件下,才可能通过选择或调整识别器来得到好的识别效果.本文研究基于改进遗传算法的人脸特征选择。
  • 摘要:在网络日益发展的今天,传统的用户身份识别方法(如帐号、密码等)已经无法满足安全的需要.生物识别技术能有效地增强系统认证的安全性,现在采用指纹、虹膜等生物特征的技术已经取得了良好的效果.与指纹、虹膜相比,人脸识别有着更为便利的优点,容易被人们接受,是目前生物识别的热门研究领域,在安全访问控制、视觉监测、基于内容的检索等方面有着重要的应用价值.同时,人脸识别也是生物识别领域内的一个难点,因为人脸具有模式可变性,形状和特征容易受光照、视角等因素的影响.目前,人脸识别方法主要有基于知识的方法、不变特征法、模板法、统计特征法等.如何检测并有效地描述人脸的特征是人脸识别中非常重要而且复杂的问题,常规的基于图像亮度梯度的图像特征检测算法存在很多局限性,而基于相位信息的图像特征检测算法具有很强的稳定性,且相位信息在人类视觉感知中非常重要.Morrone等人通过对马赫带现象的研究导致了相位一致性模型(Phse Congruency)的发展,该模型符合人类视觉感知特性.本文中,我们利用人脸相位一致性图的积分投影检测人脸不变特征。
  • 摘要:音频分类是音频分析中的一项基本任务,它为基于内容的音频检索做准备.目前对音频分类方法的研究有很多.音频特征分析和抽取是音频分类的基础.许多文献是基于时域或傅立叶变换频域提取音频信号的特征的,但由于音频信号的短时平稳性,这些方法具有一定的局限性.小波理论的出现为信号分析提供一种时频分析工具,它已经成功地应用于不同的信号分析中.音频信号经小波变换后满足不确定性原则,提高了时频分辨率,同时也符合人耳的时频分辨特性.本文运用离散小波变换,利用小波系数计算质心、带宽、子带能量和静音比等特征,并根据得到的子带能量计算前后子带能量比,利用能量比对各子带能量进行处理,得到新的子带能量.将这些特征作为音频分类的基础,根据小波域中特征向量的特点,分别构造两个不同的线性判别式函数,从而把音频分成四种不同的种类.实验结果表明这种方法比较简单,提取小波域的特征所花费的计算较少,分类准确率达到87.2%。
  • 摘要:本文首先分析了当前广泛使用的几种多分类支持向量机算法,指出它们存在的一些不足,提出了基于支持向量机的二叉树动态多分类算法,该算法不仅解决了"一对一"分类算法的不确定性问题,判别结果唯一,而且还有效地识别了出现的异常样本,并利用该异常样本作为新的算法设计的训练样本,实现算法的动态分类.其次,该算法在测试阶段,分类器的个数要少得多,计算速度要快,效率要高.通过数据也验证了它的分类的可行性和有效性。
  • 摘要:随着多媒体技术的发展,人脸图像在各种领域中具有越来越重要的作用,如人机交互系统、视频监测系统、人脸图像数据库管理系统、人脸检测与识别系统等.在各种人脸图像的应用系统中,人脸特征定位是重要组成部分之一.目前研究的人脸定位方法,基于定位所依据的基本信息的类型,主要可分为三类:一是基于模板匹配的方法,这种方法是使用可变参数的模板,在搜索区域内通过调整参数,匹配眼、鼻和嘴等人脸特征;二是基于图像灰度及色彩信息和几何信息的方法,其中利用图像灰度及色彩信息进行定位的方法是通过利用脸部特征的灰度或者色彩与人脸中其他部位不同的先验知识,进行特征定位的,而几何信息方法如Snakes和点分布模型(Point Distributed Models,PDM)方法,则是利用边界信息或者控制点的方法来定位人脸特征;三是基于外观信息的方法,如主元分析(Primary Component Analysis,PCA)方法,使用人脸特征部位的外观信息,来匹配图像中的特征部位. 本文提出一种使用ICA和人脸图像灰度信息进行人脸特征提取的新方法。从理论上讲,ICA相比于PCA方法,能够分析提取信号的高阶统计信息;从实践中,ICA用于人脸图像识别时,对于表情和姿态变化,相对于PCA有更好的鲁棒性。因此当使用ICA方法进行人脸特征提取时,能够得到更好的实验效果.本文研究基于ICA及人脸图像灰度信息的人脸特征定位。
  • 摘要:在当今网络迅速发展和广泛普及的时代,多a-gent系统(multiagent system,MAS)作为研究分布式系统的一种有效理论与方法日益得到人们的重视.MAS有效运作过程实际上是系统中agent相互作用过程.由于agent本身的自治性和有限视图限制以及MAS结构的松散耦合性,难以避免agent相互间的冲突,MAS学科领域中一项基本课题就是研究agent间冲突机理和应对策略.冲突问题般原理的理论和方法主要有系统论方法、决策论方法等;而从技术实现角度来看,主要是从集合论观点出发,结合必要应用背景,建立一套规范化操作程序与方法.讨论了具有相同结构agent组成MAS中冲突问题,其特点是将信息系统中每一个元组看作一个agent,而将给定信息系统看作MAS的一个状态;研究了结构不同agent组成MAS的冲突模型,其特点是为系统中每个agent建立一个信息表,信息表中每个元组对应agent的一个状态,通过适当条件将这些信息表"连接"起来形成一个"整体"信息系统,该信息系统就是异构情况下MAS的冲突模型.在MAS冲突研究过程中,基本问题是结合某种范围内的应用需求建立适当"可计算"模型,无论是从理论分析还是从实际应用角度来看,信息系统可能是建立冲突模型较为合适的框架.本文借鉴Rough集方法的基本思想和技术,研究基于信息系统的MAS冲突模型与冲突分析.本文出发点是同构agent结合而成的MAS,通过基本信息系统及相应导出信息系统建立相应MAS冲突模型,应用"集合序对"的数学方法,描述和分析模型中agent冲突的概念和状态层次,并且通过应用实例说明了有关思想方法和冲突计算进程.本文内容安排是:第2节建立集合序对的关系运算以作为冲突分析基本工具;第3节建立MAS冲突模型以作为冲突分析的展开平台;第4节应用相应方法和模型平台具体分析了一个具有实际应用背景的例子,以此说明本文结果的实用性和可操作性。
  • 摘要:冲突已成为当今很多领域不得不面对的、不得不考虑消解的一个现象.冲突实质上是两个或两个以上的相互依赖的个体间的一种互动关系.现实中的冲突通常伴随着不一致、竞争和协作等形式发生.通常,协作是有关双方为了实现各自的目标,在充分认识到彼此目标间的差异的基础上,"异中求同",进行广泛的、全面的协作.在多Agent系统中,每个Agent在与另一个交互时,就可能相伴出现冲突,并且也许在任务开始的时候并无显示,随着时间的推移及环境的变化,原来的计划在执行中可能会产生冲突,比如目标冲突、资源冲突等.本文试图从协作的角度出发研究冲突.
  • 摘要:20世纪90年代,agent界的研究者们致力于刻画理性agent的思维属性(信念、愿望和意图),其中出色的工作有Cohen的意图理论、Rao的BDI模型、Konolige和Pollack的KP模型.由于意图在保持各思维属性的理性平衡中起着重要作用,备受关注.基于Kripke模型,意图通常被模型化为正规模态算子,存在逻辑全知、重言隐含下的副作用、析取扩大化、合取分离等问题.针对这些问题,Konolige和Pollack给出KP模型,以非正规模态逻辑作为描述工具来表示意图.然而KP模型中用来确定意图的是可能世界集幂集的子集,和信念的表示相比不够自然,复杂度也高;而且KP模型不满足K公理和联合一致性原理,也失去了非等价意图的推理能力.把意图抽象为可能世界语义下的非正规模态算子,给出意图算子的双子集语义可以解决这些问题. 本文将在改进ATL/ATL的并发博弈结构的基础上,进一步考察多agent合作逻辑与传统BDI逻辑的融合问题。在多agent合作逻辑中分别考察六种意图:对动作的个体意图、对动作的群体意图、对命题的实现型个体意图、对命题的实现型群体意图、对命题的维护型个体意图、对命题的维护型群体意图。
  • 摘要:入侵检测系统(IDS)是一种不同于防火墙的主动保护网络资源的网络安全系统,是防范网络攻击的最后一道防线,是其他安全措施的必要补充,在网络安全技术中起着不可替代的作用.入侵检测系统包括三个功能部件:提供事件记录流的信息源、发现入侵迹象的分析引擎、基于分析引擎的结果产生反应的响应部件。 本文详细说明人侵检测模型中报警信息格式统一的问题,分析和实现了一个真实人侵检测系统中Snort和BLackIce报警信息的格式统一,以及报警名称统一的问题,从而为检测系统中的报警信息融合和处理模块提供了一种更有价值的数据,使得系统可以对网络中的安全事件做出比较准确的判断、分析和处理,生成更有效的解决方案。这大大提高了网络管理的效率。
  • 摘要:在实际中,有许多决策问题需要作到准确且快速反应,比如,在作战指挥中,根据战场信息情报,对打击目标、兵力分配、开火时机等,都需要做出合理、准确和迅速的决策,否则会贻误战机,或导致战斗失败. 而仿真是围绕实际问题进行的,在实际中决策者的决策时间可能会很短,但仿真决策者决策的过程却未必能迅速给出结果,这与系统的模型算法及内部交互关系的复杂程度有关;另外,仿真的目的也在于充分利用计算机的处理信息迅速等特点,用定性推理、人工智能、人工神经网络等方法,做成支持决策者决策的辅助系统,达到快速、准确地给出决策结论.本文主要是针对决策系统的实时仿真给出定性定量的建模方法。
  • 摘要:Web服务技术的兴起为Web的使用提出了新的计算模型,构建基于面向服务的架构(SOA)的应用是未来分布式计算的发展方向.随着Internet中Web服务的数目和种类的增加,如何在诸多服务中找到符合要求的服务,即服务匹配,成为利用Web服务进行资源共享必须解决的问题.现有的行业标准UDDI(Universal Description Discovery and Integration)提供了一种基于分布式的商业注册中心机制,进行服务描述文件的注册、管理和发现服务.这种方法主要有两个缺点:一是对于服务的匹配算法,在UDDI中,服务描述采用WSDL的方式,服务匹配比较算法往往是通过比较两者描述中语法的精确匹配来完成,一方面导致返回了语法相同但事实完全不同的错误结果,另一方面也导致了漏掉一些本质相近但采用不同语法的服务,这显然不能满足服务发现的需要;二是UDDI使用XML描述来数据结构,但XML缺乏直接的语义成为UDDI发现机制中的有一障碍.除了像UDDI一样基于分类的发现机制,OWL-S还提供了基于功能的发现机制.我们可以通过基于需要满足的输入和前提以及要得到的输出和效果来发现Web服务,将这种发现机制与基于分类的发现机制相结合,就可以得到最接近用户要求的服务。
  • 摘要:精确的时间描述语言和高效的时间推理机制是时间语义研究所追求的目标.目前,研究学者们主要采用逻辑描述方法来形式化自然语言中的时间信息,这是因为经过漫长的发展演变,逻辑描述语言已经具有一套清晰的语法、语义描述系统和证明理论,但是,只靠原有逻辑系统中的推理方法来对时间信息进行推理是远远不够的,因此,通常采用约束满足策略来弥补逻辑推理的不足,也就是说用约束满足策略使文本中不确定、不完整的时间描述精确化.目前较具代表性的时间分析及推理系统主要有这样几种:Allen的时间段运算(Allen's Interval Algebra,简称IA),Vilain和Kautz的时间点运算(Vilain and Kautz's Point Algebra,简称PA),Dechter等人的时间量值信息推理,Kautz和Ladkin以及Meiri的量值-相对关系约束联合处理法等. 本文首先分析了时间本体所包含的主要内容,然后采用逻辑语言(精确时间逻辑RTL)来描述时间本体,将句子中的时间和事件联系在一起,并形式化为一个定向约束网络,而后在此基础上进行推理,使文本中的模糊时间信息精确化。
  • 摘要:大型燃煤火电厂的过热器由于表现为纯时延长,热惯性大,且参数在不同的负荷时有较大的变化,故是一个典型的时变、非线性和大时延对象.通常,经典的串级控制系统被用于调节过热蒸汽的温度,但它只能在一定程度上改善该过程的控制质量,且有时候系统操作的工艺条件不能满足控制系统的要求.Smith预估器是处理大时延过程的有效方法,但它需要准确的过程模型和准确的纯滞后参数.被控对象模型的误差和参数的变化可使控制效果变坏,甚至不稳定.模糊控制模仿于人的模糊推理和决策,并且可以证明在许多情况下,鲁棒性比PID更好一些,但对大时延的过程,如果仅用模糊控制,也不能达到好的效果.为了改善控制系统的稳态特性和鲁棒性,本文将基于MEA的Smith预估控制用于补偿大时延,一种变域的模糊控制器被用于处理时变参数,构成对过热器这一类典型的时变、非线性和大时延对象的控制。
  • 摘要:主曲线是一个新的、非常有前途的研究领域,该领域已成为国内外学者的研究热点,并已取得了许多研究成果,但还有许多问题尚待解决,本文综述了主曲线的几个方面和进一步工作的方向,希望对该领域的研究有所帮助.我们可以预见新的理论、方法和应用将不断出现,主曲线所面临的问题将逐步得到解决。
  • 摘要:粗糙集理论与应用的核心基础是从近似空间导出的一对下、上近似算子.在粗糙集理论中有两种方式来推广定义近似算子:构造性方法和公理化方法.构造性方法是以论域上的二元关系、邻域系统或布尔子代数作为基本要素构造性地定义近似算子,然后导出粗糙集代数系统.而在公理化方法中,粗糙集代数系统和近似算子是事先由公理方式定义的,然后定义二元关系使得由二元关系通过构造性方法定义的近似算子及其导出的粗糙集代数系统恰好就是事先给定的近似算子和粗糙集代数系统.这种粗糙集代数系统是由集合代数系统中的三个集合算子(交,并,补)加上两个粗糙近似算子(下近似算子和上近似算子)而形成的.在这种意义下,粗糙集理论可以看成是集合论的又一推广形式.另外,粗糙集理论中的下近似算子和上近似算子与模态逻辑学中必然性(box)算子和可能性(diamond)算子、拓扑空间中的内部算子和闭包算子、Dempster-Shafer证据理论中的信任函数与似然函数都有着密切的联系.因此,公理化方法更有助于我们深入了解粗糙集的数学结构.在文中,Yao用公理化方法刻画了各种经典粗糙近似算子,并讨论了其生成的粗糙集代数系统与其导出的系统之间联系.Wu等在文[16,18,20,21]中对各类模糊粗糙近似算子和粗糙模糊近似算子进行了公理化刻画. 本文用公理化形式来定义粗糙模糊近似算子及其相应的粗糙集代数系统,并讨论粗糙模糊集代数系统与其导出的系统之间的联系。
  • 摘要:现代科学技术在深度和广度上都得到了迅速的发展,各学科间互相影响、互相渗透,已经形成一个多层次、多分支而又紧密联系在一起的庞大知识体系.非线性问题作为系统科学的研究对象,近年来得到了各界学者的广泛关注.但是传统的非线性分析要求的条件往往过于苛刻,而结合泛系方法论来研究非线性问题则可以适当扬弃这些条件.比如说,无论是线性结构还是拓扑结构,都不必分析结构;无论是函数、关系、算子,还是基本论域,都被视为非线性的.这使得对非线性问题的研究具备了更大的普遍性与适用性.本文研究粗集理论中连通解耦特性间的关系及其相互转化。
  • 摘要:粗糙集理论已成功应用于人工智能,计算机理论等领域.等价关系是经典粗糙集模型中的重要关系,但条件要求高,难以应用推广.文中利用非等价关系来推广经典粗糙集并引入各种广义近似算子.进一步,文研究了基于经典二元关系的k-步邻域和近似算子.结合模糊概念,从模糊二元关系及模糊集合出发,我们提出了k-步模糊粗糙近似算子并对其性质进行了研究。
  • 摘要:教学质量评价是学校教学质量管理的重要环节和内容.开展教师课堂教学质量评价对于引导教师不断进行教学内容、教学方法的改进,提高教学质量和水平具有积极意义和重要作用.由于教学质量评价具有复杂性、多因素性和模糊性等特点,是一类有大量不确定因素的半结构化问题或非结构化问题,许多因素难以科学地计算和评估,因此教学质量评价是一项主观因素很强的工作,其结果可能偏离被评估对象的实际情况.如何客观、科学、全面地对教学质量进行评价,以提高教学评价的科学性、客观性和准确性,是现代教学质量评价研究中的一个非常重要的课题,这对于提高教师的师资水平和教学效果,提高人才培养质量,促进教育事业的发展具有一定的理论意义和实际应用价值.本文利用Rough集理论来研究教学质量评价问题,对教学质量评价指标体系进行约简,并给出评价指标权重的确定方法,从而有效地消减了指标体系规模和削弱权重设置的主观性。
  • 摘要:自1981年Howard与Matheson提出影响图这一图形决策技术以来,许多复杂知识处理系统都建立在贝叶斯网络和影响图之上,这样的表示方法已经成为解决现实决策问题的有效框架.但是,获取定量的联合概率分布却成为了这种框架解决现实决策问题的主要障碍.当依赖关系或者相关参数值无法精确描述时,如何利用非精确的信息进行推理已成为提高影响图决策效率的关键问题. Rough集是由Pawlak于1982年提出来的,研究不完整数据、不确定知识的表达、学习及归纳的理论方法.Rough集的提出为研究不精确数据的分析、推理,挖掘数据间的关系、发现潜在的知识提供了有效的工具.Pawlak和Yao等学者在后续工作中又进一步研究了基于概率的Rough集模型. 本文所探讨的基于Rough集的影响图,是将影响图中节点间的依赖关系用基于概率的Rough集来描述和表达;同时,将基于概率的Rough集的决策规则融合于影响图的图形结构之中。
  • 摘要:本文根据变精度粗糙集理论,提出了基于变精度粗糙集的多指标综合评价方法.通过对教学质量评价实例表明,这种方法不仅可以简化评价指标体系,减少评价时间,降低评价成本,而且利用变精度粗糙集中属性的近似依赖性,进行完全由数据驱动的评价,保证了评价结果的客观性.同时,该方法在一定程度上弥补了基本RS模型处理实际问题的不足,提高综合评价的准确率,得到的结果更符合实际评价要求,有较大的应用价值.但是,该方法还需要粗糙集领域对β取值的稳定性研究及相关算法研究的支持。
  • 摘要:决策树是一种直观的知识表示方法,由决策树导出的决策规则简单而易于理解.决策树学习目前已被作为一种重要的机器学习方法而被广泛使用,它主要用于概念学习及归纳推理.决策树学习就是一个决策树的构造过程,其基本思想为:自顶向下构造决策树,树的每个非叶结点表示一个属性,从该结点发出的每个分支对应于该属性的一个取值,这样每个样本实例根据其属性值最终在叶结点被决策树分类. 决策树分类的质量取决于叶结点的数量和叶结点的深度,根据Occam剃刀原理,生成的决策树包含的叶结点数越少且每个叶结点的深度越浅,则该决策树的质量越高.因而构造最优决策树是决策树学习算法研究的主要方向,然而这已被证明是一个NP-hard问题.本质上,构造决策树的过程就是一个选择非叶结点属性的过程.因而不同的属性选择标准构成了不同的决策树学习算法.具有较大影响的由Quinlan提出的ID3算法使用信息增益作为选择非叶结点属性的标准.ID3算法在决策树上的每个非叶结点只选择单个属性,且对属性间的相关性考虑不够,因而容易导致决策树中子树的重复和某些属性在同一决策树上被多次选择.为此,许多学者提出了不同的决策树学习算法.特别地,应用粗糙集理论构造属性选择的启发式函数来建造决策树已被许多作者所研究[6~9].本文对此进行了进一步的研究。
  • 摘要:由波兰Pawlak.Z教授提出的粗糙集(Rough Set)理论作为处理不确定问题的一种有效工具,在数据挖掘、知识发现和粒度计算等领域有着广泛的应用.近年来,将粗糙集理论用于图像分析技术领域成为新的研究热点,出现了基于粗糙集的图像特征提取、图像分割、图像检索及字符识别新方法,图像理解中的区域语义标记和理解类似于图像检索方法,但区域语义理解不同于固定层次结构的检索分类,具有很强的不确定性,因此本文在对前期目标识别研究工作的基础上拓展至更为广泛的区域标记和语义理解是一种新的尝试,由于区域中提取的视觉特征在一定程度上存在极大的冗余,影响了最终的理解决策过程,因此采用粗糙集合进行特征属性分析非常必要。
  • 摘要:撰写学位论文是高等学校本科教学过程的一个重要环节,其目的在于综合训练学生运用所学的基本理论、基本知识和基本技能,分析和解决实际工作问题的能力,完成相应学科高级技术人才的基本训练,使学生具有从事生产和科学研究的初步能力.如何对这种能力进行评价,对学位论文质量进行评价,对评价方法的研究受到越来越多学者的关心.王磊等人提出针对博士学位论文用加权平均的方法处理定量评价的数据,应用模糊综合评判的方法处理定性评价中分档评价的结果,用评语关键句的方法处理定性评价中的评语,并可将定量和定性评价相结合进行综合评价. 本文采用粗糙集属性约减理论对学位论文质量进行评价.文章内容是这样安排的:第1部分是粗糙集理论基础知识介绍;第2部分介绍属性个数增长方式的属性核求解算法,得到分明矩阵的最小属性约简;第3部分是基于粗糙集理论的学位论文质量评价模型,并通过实例得到相关决策规则。
  • 摘要:随着我国加入WTO和经济市场化的进一步深入,铁路所面临的形势越来越严峻.如何应对日益激烈的竞争,如何应对瞬息万变的市场,是铁路各级各部门决策者面临的新的挑战.传统的决策支持系统是基于模型的.经过近年来与迅速发展的数据仓库技术的结合,产生了一个新的类型:基于数据仓库的决策支持系统.数据仓库是一个以支持企业或组织的决策分析处理为目的的、面向主题的、集成的、永久的、随时间不断变化的数据集和.基于数据仓库的决策支持系统通过使用联机分析处理(OLAP)和数据挖掘技术,能够对大量的历史数据进行深层次的分析和挖掘,从中找出潜在的规律,在复杂的环境中向决策者提供决策支持. 本设计就是以铁路综合信息为数据基础,以数据仓库为基本存储架构,以数理统计和数据挖掘为核心技术,以知识库、模型库作为知识和方法存储结构的信息综合决策支持系统。
  • 摘要:运动特征作为视频数据所独有的信息,是视频检索的重点研究对象,但很多关键帧算法都没有考虑运动信息.本文先从每个镜头的P帧中挑选出符合预先要求的关键帧构成决策属性,再从MPEG压缩视频流中提取运动数据构成条件属性,用Rough Set平台对所有属性进行分析处理,提取运动信息与关键帧之间的决策规则,将提取的规则与预先的要求进行比较和验证.从实验结果得出该算法可行,尤其在运动强度大的视频片段中运用该算法的效果更好.提取的关键帧大部分运动强度偏大并且运动分布集中在中央,该算法与其他算法比较具有内容重叠少,速度快,概括内容全面的特点.在将来的工作中我们打算研究进一步的应用来管理视频数据,将其应用到视频检索的系统中。
  • 摘要:粗糙集理论是波兰科学家Z.Pawlak于1982年提出的一种处理模糊性和不确定性的数学工具.其早期研究成果主要是针对完备信息系统的,基于不完备信息系统的粗糙集方法,近些年取得了一些重要的进展.从不同的角度出发,文通过运用由数据导出的相容关系、量化容差关系和限制容差关系分别提出了不同的针对不完备信息系统的粗糙集扩展模型.与以上模型不同,提出的粗糙集理论模型对相容关系的结构进行深入分析,证明了极大相容块是不完备信息系统中的最小知识颗粒;以极大相容块为基本知识颗粒定义的近似算子比以对象的相容类为基本知识颗粒定义的近似算子有更高的近似精度;对于决策系统而言,以极大相容块为基本单位构造区分矩阵,简化了区分矩阵的规模,提高了用区分矩阵求约简的效率. 文所提方法的优势均是以获得属性集所决定的极大相容块为基础的,所以研究极大相容块的快速构造算法显得尤为重要.本文基于极大相容块技术的粗糙集模型,研究了不完备信息系统中极大相容块的性质,提出不完备信息系统中极大相容块的分层递阶构造算法,并通过实例进行了验证。
  • 摘要:波兰数学家Z.Pawlak于1982年提出的粗糙集合理论,是一种处理模糊和不确定性问题的数学工具,在人工智能、知识发现、模式识别与分类、故障检测等方面得到广泛应用.相对于统计学、证据理论等处理模糊和不确定性问题的数学工具而言,粗集理论不需要关于数据的背景知识,将知识定义为不可区分关系的族集,赋予知识明确的数学意义,用严格的数学方法处理不确定性的问题,这为进一步分析数据提供了一种有效的手段。本文研究一种基于粗集的决策表属性约简新算法。
  • 摘要:在中国篮球职业化蓬勃发展的今天,俱乐部工作的重心之一就是对人才一运动员的管理,尽管篮球比赛中记录下了大量的第一手比赛数据,但是不同的运动员特点和个性不同,如何综合评判各个运动员的实力,无论是对俱乐部进行运动员交易,还是管理部门评价MVP都具有十分重要的经济意义和社会效益.传统的评价方法都避免不了对评价对象在阈值附近的数据评价产生跳跃式变化的不合理"59现象",一差一分59为不及格、60为及格.至于对于没有具体可以参考的数据的因素的评价更是无从下手,模糊数学通过模糊子集,很好地解决了这个问题.为此,本文以模糊数学为研究工具,研究了对篮球运动员进行评价的模糊综合评判系统和软件。
  • 摘要:本体作为一种重要的知识表示工具,用于知识的存储,信息的检索等领域,然而,本体的生成方式多是手工或者半自动的方式,耗时费力.近年来,形式概念分析支持本体半自动的生成方法已相对成熟,但缺点是生成的本体针对精确信息,无法表示模糊信息,本文提出了一种基于模糊概念格上聚类的本体生成算法。
  • 摘要:自从W.L.Gao和D.J.Buehrer提出Vague集理论以来,该理论已在包括近似推理在内的智能系统中得到广泛的应用,Vague(值)集间的相似度量成为实现这些应用的主要工具之一.许多作者提出相似度量公式,并分别研究了它们的性质.但什么样的函数才可作为Vague(值)集间的相似度量,应该有一个统一的标准.为此给出Vague(值)集间的相似度量的公理化定义.并提出两个Vague(值)集间的新的加权相似度量.已知的大多数Vague(值)集间的相似度量公式是满足这个定义的.但也有不满足此定义的公式,并举例说明其作为Vague(值)集间的相似度量确实是不适合的. 本文把文提出的近似推理模型加以细化,并应用本文提出的一个Vague值间加权相似度量的公式进行近似推理,实例表明这样的近似推理是可行的。
  • 摘要:Hobbs于1985年提出了粒度的概念,并对公式中的谓词定义了不可区分关系.T. Y.Lin教授1996年到1997年期间第一次提出粒计算的概念,粒计算的基本思想是在问题求解中使用粒子.构建信息粒的过程称作信息粒化,信息粒化的过程就是将一类对象划分为一系列粒,其中每一个粒是基于不可分辨关系、相似性或者泛函数聚集而得到的一些对象的集合.然而对于粒的度量而言,方法各种各样,但常常带有主观性.对同一论域上的粒计算,不同的人用不同的判断标准,对不同的度量结构又导致了该信息粒呈现出不同的分类,所得出的度量值及意义也不尽相同.为了建立能够合理地测度信息粒的度量函数,必须规定若干条粒度的性质. 粒的各种划分间的相似性度量还未有明确的方法,本文就粒的划分间的相似性度量进行了深入研究.为了描述信息粒的接近程度,我们提出了粒的贴近度的概念.由于实际问题的复杂性,在某一问题上适用的贴近度公式很有可能不适用于另一场合,因此提出各种各样的贴近度公式对解决相关问题是非常必要的。
  • 摘要:人工智能领域的粒度是信息颗粒大小的平均度量.信息颗粒是人类处理和存储信息能力的一种反映,通常是在数值水平上,根据信息的相似性、不可分性、一致性、函数关系等被划分在一起而形成的实体.人类在处理复杂信息问题时,由于能力有限,需要把复杂信息按照各自特征划分为若干较简单的块,这些块就被看成是信息颗粒.信息颗粒在许多方面都有特别意义,诸如区间分析、数据推理、整体分解、决策树、语义网络、图像分割等等.本文研究基于逆向云模型的粒度计算。
  • 摘要:本文基于较原始的基于像数网格点信息模式匹配识别算法的基础上进行,而近年来在数字识别领域的一些新的特征提取和特征的选择方法:例如:穿越次数特征,基于笔画方向的特征,周边笔画方向特征构成周边笔画方向特征,结构特征等及多分类方法结合的方法都是我们下一步可以研究的对象.随着新特征的研究及实验本身算法的优化,我们相信其识别效率还可以有较大的提高空间。
  • 摘要:关联规则是数据库中存在的一种十分有用的知识模式,其挖掘算法已得到较为广泛的重视和研究,并取得了较大进展.粒计算作为一种新的信息和知识处理的方法近来已经被许多研究者所重视,以及在许多领域中的得到应用.基于粒计算的关联规则的提取是从另一个角度来实现关联规则的挖掘.它将事务数据库通过某种关系转化为信息粒,并用一个二进制串形式表示信息粒,然后通过二进制与运算得到相应频集,最终得到我们需要的关联规则.这种方法在语义上形象地反映了事务的特征,并且在速度上也会有所改善,对于在海量的数据中进行规则的提取是具有实际应用意义。
  • 摘要:在分类问题中采用基于后验概率的支持向量机,能够得到更多的信息,也更接近真实情况,所以在实际问题中可以获得更好的分类准确性.对本文中的基于后验的支持向量机与-支持向量机的等价性问题在今后的工作中还需进一步深入研究其内在原因。
  • 摘要:特征子集选择问题是指从一个给定的候选特征集合中,根据一定的评价标准,选出一个特征子集,使其能够一致地描述给定的例子集合.很明显通过特征子集选择,可以减少描述原数据集合的特征(属性)的数目,进而可以减少原数据集合的例子数.而在实际应用中,数据挖掘或模式识别所处理的对象是大型的数据库.其中每个记录都包含了许多特征(属性),由于在数据的采集过程中,可能会因为某些特征提取费用或设备和人为等原因,造成了属性集合中包含了一些未知的、无关的或冗余的特征(属性).这些特征(属性)的存在会给数据挖掘或模式识别算法带来很多麻烦.近年来,随着机器学习和数据挖掘在实际领域中的不断应用,特征子集选择算法研究逐渐成为人工智能领域的一个研究热点,因为通过特征子集选择。本文简介NFS算法和基于半贪心策略的特征子集选择算法。
  • 摘要:通过对文本集的词-文档矩阵进行奇异值分解(SinguIar Value Decomposition,SVD),提取K-秩近似矩阵近似表征原词-文档矩阵,左右奇异向量分别为词向量和文档向量,在此基础上进行文本分类和其它各档处理,这就是隐含语义索引技术.本文对此问题进行了研究.该文利用查询向量和各文本向量之间的夹角余弦表示相似程度,寻找和用户查询最相似的文档集合,并按相似度的高低排列,将相似度大于用户预先设定的阈值的文档返回给用户。
  • 摘要:本文给出了一种基于进化规划的K-均值聚类算法.从实验中我们可以看出,该算法与基于遗传算法的K-均值算法相比,在性能和效率上有很大改进.这种性能的提高主要得益于进化规划算法强大的全局寻优能力。
  • 摘要:本文在基于数据项约束的条件下研究了如何更加有针对性地挖掘长闭合序列模式,通过实验证明,与传统的闭合序列挖掘方法相比,基于约束的倒序闭合序列挖掘算法InverClos不仅拥有更高的时空性能,并且有更好的实际应用前景.如何避免预先设定的支持度阈值对闭合序列的产生及决策支持的负面影响,将是下一步研究的目标与方向。
  • 客服微信

  • 服务号