首页> 中文学位 >基于XMARC信息描述的知识标引与概念检索研究
【6h】

基于XMARC信息描述的知识标引与概念检索研究

代理获取

目录

文摘

英文文摘

东华大学学位论文版权使用授权书

东华大学学位论文原创性声明

第一章绪论

1.1研究背景

1.2研究现状

1.2.1机读目录元数据

1.2.2信息自动标引方法与技术

1.2.3主题信息分类概念检索

1.3论文研究内容

1.4论文结构

第二章MARC元数据的组织与现状

2.1 MARC标准

2.1.1元数据概述

2.1.2 MARC的产生及其标准

2.2 CNMARC信息组织

2.2.1 CNMARC结构

2.2.2几个重要数据字段的组织

2.3 MARC的应用与发展

2.3.1在图书馆界的广泛应用

2.3.2网络环境下MARC标准的扩充

2.4 CNMARC档案信息的处理

2.4.1档案界MARC的现状和实践

2.4.2 CNMARC AMC系统开发概述

2.5领域的其他元数据比较研究

2.5.1 DC元数据与CNMARC核心元素集

2.5.2 EAD元数据与CNMARC多级结构

2.6小结

第三章基于XML的MARC信息描述机制研究

3.1 MARC信息描述的优势和局限

3.1.1信息的描述与格式

3.1.2信息的存储与交换

3.1.3信息的加工与处理

3.1.4信息的检索与发布

3.2 XMARC信息描述的理论研究

3.2.1 MARC与XML

3.2.2 XML DTD与XML SCHEMA

3.2.3基于XML DTD的CNMARC信息描述

3.2.4基于XML SCHEMA的CNMARC信息描述

3.3 XMARC信息描述的实践研究

3.3.1基于XMARC资源描述框架的DTD设计

3.3.2基于XMARC资源描述框架的SCHEMA设计

3.3.3基于XML SCHEMA的CNMARC核心元素集设计

3.3.4 MARC对XMARC的信息映射

3.4小结

第四章主题概念词义关系及其转换的研究与构建

4.1主题概念与主题词表

4.1.1主题词的语义性

4.1.2主题词表的体系结构

4.2主题词表的知识表示

4.3主题词语义关系的组织与实现

4.3.1词表数据的预处理

4.3.2主题词语义关系的组织

4.3.3主题范畴索引的生成

4.3.4主题词族索引的生成

4.4 K-S-C主题概念知识库方法

4.4.1基于中文词概念的K-S-C知识关系结构

4.4.2基于词素相似度的主题知识转换方法

4.5小结

第五章基于XMARC的主题知识自动标引研究

5.1中文信息自动标引的方法与技术

5.1.1信息标引的理论基础

5.1.2中文信息自动标引研究进展

5.2基于K-S-C语义关系的自动标引

5.2.1面向主题标引的切词和抽词方法

5.2.2预处理特义中文禁用字词的切分算法SWF

5.2.3长词匹配短词回溯的中文抽词标引算法EMM

5.3 XMARC主题信息的标引挖掘技术

5.3.1 XMARC的主题知识标引

5.3.2 XMARC文档的关系存储

5.3.3 XMARC主题块信息的标引挖掘

5.4小结

第六章基于XMARC的主题分类概念检索研究

6.1中文信息的概念检索

6.1.1信息检索的理论基础

6.1.2中文信息的概念检索

6.2基于K-S-C语义关系的概念检索

6.2.1基于主题知识的概念信息检索

6.2.2 K-S-C检索研究及其主题范畴模式抽取

6.2.3主题语义词素相似度及其匹配算法

6.3 XMARC主题分类概念的检索

6.3.1基于主题知识标引的XMARC词句概念检索

6.3.2基于抽取范畴模式XMARC分类概念检索

6.4实验结果

6.4.1评价指标

6.4.2实验环境

6.4.3实验内容

6.4.4实验结论

6.5小结

第七章总结与展望

参考文献

附录

攻读学位期间发表的学术论文目录

致谢

展开▼

摘要

MARC(Machine Readable Catalogue机读目录)作为一种元数据格式,在信息描述、存储、交换、标准化和检准率方面具有不可比拟的优势.经过30多年的发展和在国内外图书馆界的广泛应用,目前仍有继续存在和发展的必要.但其专业性强、著录速度慢和结构复杂等局限性,使MARC满足不了当前网络海量信息资源的整序需求.档案MARC是实现该领域网络资源管理所必须解决的关键问题之一,中国至今还没有档案MARC的正式标准.国内外对网上MARC集中信息的描述及其实现技术尚没有深入研究,如何真正发挥集成、共享目录信息的文化与知识属性已成为当前的迫切需要.以主题标引为基础的主题检索是当今图书馆、情报和档案部门现代化发展的必然趋势,研究、使用主题知识并实现自适应分类和基于语义知识转换的概念检索,是提高目前网上信息检索软件或搜索引擎质量的关键内容.主题自动标引的分词技术很难从根本上解决,所以在很长时间内一直受到人们的关注.目前,国内外对主题的研究,基本还停留在主题词层面上的处理,基于主题概念的自动标引和自动检索,已经成为当前中文信息开发与利用的主要瓶颈之一.该文主要的工作是围绕五个方面展开的:建立网络环境下基于XML的XMARC信息描述理论体系,比较设计领域的XMARC元数据,构建以

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号