首页> 中文学位 >基于语义网的文本信息分类技术研究
【6h】

基于语义网的文本信息分类技术研究

代理获取

目录

文摘

英文文摘

声明

1绪论

1.1研究背景和研究意义

1.2文本分类在数字化图书馆领域的应用现状

1.2.1数字图书馆的概念

1.2.2目前数字图书馆中存在的问题

1.2.3文献分类法在网络信息资源组织中的作用

1.2.4数字图书馆中的文本分类

1.3语义网与文本分类

1.4本课题的研究内容

1.5本论文的组织

2本体与语义网

2.1本体论(Ontology)相关知识

2.1.1本体的概念

2.1.2本体的分类

2.1.3本体的描述语言

2.2 Ontology和语义Web

2.3领域本体之间的不匹配问题

3文本分类相关技术及系统设计

3.1文本分类技术

3.1.1文本分类概述

3.1.2传统文本自动分类问题的一般性描述

3.2 Web文档分类技术

3.3基于语义网的文本分类系统概述

3.3.1杜威十进制分类法(DDC)和美国国会图书分类法(LCC)简介

3.3.2领域本体的构建

3.4基于Semantic Web的文本分类系统总体设计思想

4基于语义网的文本分类

4.1文本分类的定义

4.2传统文本分类方法的局限性

4.3语义Web与Ontology

4.4基于语义网的文本分类

4.4.1构建领域本体论

4.4.2自动分类的工作方式

4.4.3分类实验与评估

5总结与展望

致谢

参考文献

展开▼

摘要

随着因特网上信息的大量增加,如果不依靠自动分类而完全通过手工进行文本分类,文本分类是不可能完成的。因此,文本自动分类成为一个重要的研究领域。 而网络资源缺乏统一的语义描述,用户越来越难从海量的数据中查找到自己需要的资源,W3C组织倡导的基于本体的语义网技术为解决这一问题提供了出路,语义网通过获得词汇的语义使Web应用不但能够表示信息,而且能够理解信息,还可以在此基础上依据一定的规则对文本进行分类。 在这篇论文中,我们首先介绍了语义网及其相关技术,然后介绍了Web文本分类的方法以及本体与语义网之间的相互关系,最后介绍了基于本体技术的语义网的自动分类器。此分类器可以对关于杜威十进制的分类法(DDC)和国会图书馆分类法(LCC)的文本进行分类。 在介绍分类器的过程中,我们首先解释如何以模块化的方式构建本体,并把本体映射到DDC和LCC中。其次,我们正式定义了DDC-LCC之间和本体-分类表之间的映射。接着,我们解释了分类器使用本体进行分类的方法。最后,我们通过实验对分类器的精确性进行评估,实验结果证明我们的方法改善了分类的精确性,由于不完整的本体的使用,精确性改善的同时匹配率有所下降。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号