首页> 中文学位 >基于关键词聚类的本体层次关系构建研究
【6h】

基于关键词聚类的本体层次关系构建研究

代理获取

目录

文摘

英文文摘

论文说明:图表目录

声明

致谢

引 言

1 本体自动构建研究

1.1 本体的定义和作用

1.2 本体自动构建研究概述

1.2.1 自动构建对象

1.2.2 自动构建技术

1.3 本体层次关系自动构建

1.3.1 基于语言模式匹配的方法

1.3.2 基于统计的方法

1.4 本章小结

2 自动聚类相关技术研究

2.1 基于VSM的聚类样本表示

2.2 词语相似度计算

2.3 经典聚类算法

2.3.1 聚类主要算法比较

2.3.2 EM算法

2.4 词聚类技术

2.4.1 利用模糊认知图的词语聚类

2.4.2 基于共现的词聚类

2.5 本章小结

3 KCBHC的总体设计和聚类前处理

3.1 总体流程设计

3.1.1 基本思想

3.1.2 构建流程设计

3.1.3 资源和工具准备

3.2 数据预处理

3.3 基于VSM的聚类前各环节工作和实验

3.3.1 关键词选择和获取

3.3.2 特征向量选取和向量空间的生成

3.3.3 权重计算和归一化处理

3.3.4 数据格式转化

3.4 本章小结

4 情报学本体层次关系构建实验

4.1 聚类算法的选择和评价

4.2 基于EM算法的多层次聚类

4.2.1 步骤与方法

4.2.2 实例介绍

4.3 聚类后的组织与修剪

4.4 本章小结

5 实验结果评价

5.1 内部评价

5.2 外部评价

5.2.1 环境搭建

5.2.2 测试内容和结果

6 结论与后续工作

6.1 总结

6.2 问题和后续研究内容

参考文献

附录

作者简介

展开▼

摘要

由于本体在智能信息处理中重要的应用价值,已引起国内外计算机、图书情报和生物信息等诸多领域的广泛关注及研究应用。基于以上事实,本体构建显得尤为重要和迫切。人工构建本体费时、费力、难以维护和存在主观因素。另一方面,目前的本体的编辑、表示、维护方法与工具依然离不开专家的参与,自动化较低。因此,针对本体的大规模应用,半自动化或者自动化构建本体具有重要的研究意义和应用价值。 层次关系体系作为本体的基本概念框架,是自动构建本体的关键部分。为此,本文探讨了自动构建本体层次关系体系的方案和技术,使用关键词聚类技术来构建层次关系体系。本文的创新之处在于:(1)探索关键词聚类在半自动构建本体层次关系方案的可行性;(2)总结在关键词提取、特征选取、特征值计算和聚类算法选择方面达到好的聚类效果的经验;(3)通过实验,构建若干情报学类别下的层次关系体系,该方法构建的层次关系对学科的知识体系揭示的比较深入和详细,同时能反映学科发展的现状。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号