首页> 中文学位 >基于文本分类的本体匹配及其应用研究
【6h】

基于文本分类的本体匹配及其应用研究

代理获取

目录

摘要

ABSTRACT

1 绪论

1.1 课题的背景和意义

1.2 互联网的数据组织形式及其现状

1.3 语义WEB 的体系结构

1.4 本体论及其研究现状

1.4.1 本体的定义及相关概念

1.4.2 本体的描述语言

1.4.3 描述逻辑

1.4.4 本体的构建方法

1.4.5 本体的开发工具

1.4.6 本体的应用

1.4.7 本体匹配的方法

1.4.8 本体及本体匹配的研究现状

1.5 论文的主要研究内容

2 基于贝叶斯分类器的文本分类技术研究

2.1 文本分类概念

2.2 问题描述

2.2.1 文本分类问题描述

2.2.2 单标号文本分类与多标号文本分类

2.2.3 类别中心分类与文档中心分类

2.3 文本分类应用

2.3.1 自动索引

2.3.2 文本过滤

2.3.3 Web 文档分类

2.4 文本分类模型的评估

2.4.1 分类模型的评估

2.4.2 评估指标

2.5 朴素贝叶斯文本分类方法及其改进

2.5.1 朴素贝叶斯文本分类方法及其存在的问题

2.5.2 相关特征项对文本分类的影响

2.5.3 特征项相关性的度量

2.5.4 基于特征相关性的朴素贝叶斯文本分类模型

2.5.5 反馈方法应用于贝叶斯文本分类

2.5.6 实验环境的构建

2.5.7 实验采用的关键算法

2.5.8 实验及结果分析

2.6 小结

3 基于支持向量机分类器的多类文本分类技术研究

3.1 SVM 分类原理

3.2 SVM 分类中的模型选择及优缺点

3.3 SVM 分类的主要问题及解决方法

3.4 一种改进的多分类支持向量机

3.4.1 现有多分类支持向量机

3.4.2 基于二叉树的多类支持向量机原理及算法描述

3.4.3 二叉树多类支持向量机改进

3.5 多类支持向量机文本分类实验

3.5.1 实验比较的方法

3.5.2 基于多类支持向量机的文本分类器

3.5.3 实验环境

3.5.4 实验及结果分析

3.6 小结

4 本体概念的相似度评估

4.1 问题描述

4.2 本体匹配的应用领域

4.3 本体集成的主要模式

4.4 本体匹配的主要方法

4.5 主要的本体匹配框架

4.5.1 Anchor — PROMPT 方法

4.5.2 Cupid 方法

4.5.3 GLUE 方法

4.5.4 Similarity Flooding 方法

4.6 基于文本分类的本体匹配框架

4.6.1 基于文本分类的本体概念分类器的构造

4.6.2 基于实例分类的概念相似度的度量

4.6.3 两个概念的相似度计算算法

4.6.4 基于半结构数据信息的相似评估策略

4.6.5 基于选举策略的概念匹配对选择策略

4.6.6 实验以及结果分析

4.7 小结

5 本体匹配方案的测试评估

5.1 问题描述

5.1.1 本体错误产生的原因

5.1.2 本体错误的类型

5.1.3 本体匹配的概念可满足测试

5.2 描述逻辑与推理算法

5.2.1 OWL 与描述逻辑基础

5.2.2 Tableaux 算法和基于描述逻辑的推理

5.3 基于描述逻辑匹配方案评估

5.3.1 概念可满足性测试

5.3.2 匹配方案的评估方法

5.3.3 本体匹配以及评估实例

5.4 基于本体语义满足性的评估技术

5.4.1 概念语义可满足性测试

5.4.2 基于语义匹配方案的评估方法

5.4.3 基于语义匹配方案的评估方法分析

5.5 概念间依赖关系检测概念的可满足性

5.5.1 概念不可满足性的依赖简介

5.5.2 不可满足性的依赖检测算法思想

5.5.3 不可满足性的依赖检测算法

5.6 小结

6 本体匹配在知识学习中的应用研究

6.1 知识学习概述

6.2 知识教学系统

6.2.1 网络教学系统

6.2.2 LMS 学习管理系统

6.2.3 LTSA 学习技术系统

6.3 概念型智能学习系统模型(CILSM: CONCEPTURAL INTELLIGENCE EARNING SYSTEM MODEL)

6.3.1 CILSM 系统框架

6.3.2 基于CILSM 的个性化学习实现方法

6.4 共享网络资源的本体学习技术研究

6.4.1 学习资源元数据标准

6.4.2 学习资源元数据的语义

6.4.3 面向CILSM 的本体学习研究

6.5 基于本体的知识集成和查询

6.5.1 问题描述

6.5.2 本体映射示例

6.5.3 概念型智能学习系统模型CILSM 的本体匹配过程

6.6 小结

7 总结与展望

7.1 主要结论

7.2 后续研究工作的展望

致谢

参考文献

附录

A. 作者攻读博士学位期间发表或录用的论文

B. 作者在攻读博士学位期间参加的科研项目

C. 作者在攻读博士学位期间主持的科研项目

D. 作者在攻读博士学位期间获奖的科研项目

展开▼

摘要

语义Web不是一种全新的Web,而是对当前Web的扩展,其中的信息被赋予明确的含义,使机器和人能更好地的协同工作。语义Web的基础之一是本体,为了让机器能够理解Web的内容,需要建立本体,并利用本体中定义的概念作元数据来标记Web的内容。语义概念的相似性度量一直以来都是人工智能领域的研究热点。人工智能领域的相似性度量模型致力于从特定的知识表述中计算出概念间的相似性。本论文以文本分类的机器学习理论为基础,提出了本体概念匹配的整体框架,借助改进的贝叶斯(Bayes)分类器和支持向量机分类器分析本体中的个体实例特征,建立了一个基于实例的本体概念相似性度量模型,给出了基于文本分类的概念相似性度量算法,并提出了概念匹配后概念的可满足性和本体一致性的检测策略。最后,本文将提出的本体匹配理论用于网络教育的概念型知识学习系统,使论文的研究成果体现在该系统中。现将论文的主要研究内容概括如下:①介绍和综述论文的理论基础。主要包括语义网、本体论、文本分类技术、描述逻辑推理及其研究现状。②基于Bayes的文本分类模型的研究。朴素贝叶斯分类算法是一个简单、有效而且在实际使用中很成功的分类算法,其性能可以与其他典型分类算法相媲美,在某些场合还优于其他分类器。本文在引入互信息等因素后,提出了基于特征相关性的朴素贝叶斯文本分类改进模型,对于大部分类别的资源,改进后的朴素贝叶斯算法都能得到较高的准确率和召回率,同时该分类器对各类别资源分类性能提高的效果不一样。事实上,该模型引入了语义特征,建立了传统特征与概念、概念与类别的映射关系。③基于支持向量机(SVM)的文本分类模型研究。基于统计学习理论的支持向量机算法具有坚实的数学理论基础和严格的理论分析,具有理论完备、全局优化、适应性强、推广能力好等优点,是机器学习中的一种新方法和研究的新热点。它使用结构风险最小化原则,综合了统计学习、机器学习和神经网络等方面的技术,在最小化经验风险的同时,有效地提高了算法泛化的能力。它与传统的机器学习方法相比,具有良好的潜在应用价值和发展前景。本文针对基于二叉树的多分类支持向量机自身存在的问题,提出了改进二叉树结构生成的思想,最后对这种改进的树结构算法进行了设计及分析。改进后的BT-SVM多分类方法有比较高的分类准确率,它用于多类文本分类达到了预期的效果。④本体概念相似度计算算法。在分析了目前常用的本体匹配技术的基础上,提出了基于文本分类技术的本体概念匹配的框架。算法的主要思想是利用本体中概念的文本实例集,通过训练获得概念的文本分类特征。再对本体概念的文本数据集进行交叉学习分类和计算并获取了两个本体所有概念对的相似度评估矩阵。为了充分利用多种分类器的优势,在概念匹配过程中,给出了利用概念对相似度的突出度策略,克服了单一文本分类器对某些文本数据不敏感的问题,同时还给出了利用本体半结构信息来帮助分类的策略。根据对真实Web数据集的测试结果,表明本文提出的本体概念匹配算法具备很好的匹配精度。⑤基于描述逻辑及其推理机方法。它能够实现本体一致性和可满足性的全面测试和分析。然而要使用推理机实现本体测试的前提是需要完成实例数据的匹配和关联的处理,这将对本体匹配方案的评估带来巨大的工作量,本文提出了面向语义的本体匹配评估策略,进一步拓展了本体概念之间的关系,并对实际工程应用具有重要的参考意义。⑥概念型智能学习系统模型(CILSM:ConcepturalIntelligenceLearningSystemModel)。目前,网络教学系统促进了教育的发展,但其本质是传统教学的扩展,而不能完全适应信息社会终身学习的需要,因为它们只是一个新型的学历教育系统。由于Web是当前最丰富的学习资源,所以本文提出的CILSM系统则是广泛利用Web的资源,并将这些资源(知识)的固有属性和教学属性,采用计算机可处理(可读、可推理)的方式进行组织,形成“知识空间”(KnowledgeSpace)。知识空间用资源描述框架(RDF/RDFS)元数据描述,并用Web本体语言(OWL)描述的本体组织知识。知识空间包括多个本体,而本体匹配是系统亟待解决的问题,本文提出的本体匹配框架和算法在一定程度上解决了该问题。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号