文摘
英文文摘
东华大学学位论文版权使用授权书
东华大学学位论文原创性声明
第一章绪论
1.1研究背景
1.2研究现状
1.2.1机读目录元数据
1.2.2信息自动标引方法与技术
1.2.3主题信息分类概念检索
1.3论文研究内容
1.4论文结构
第二章MARC元数据的组织与现状
2.1 MARC标准
2.1.1元数据概述
2.1.2 MARC的产生及其标准
2.2 CNMARC信息组织
2.2.1 CNMARC结构
2.2.2几个重要数据字段的组织
2.3 MARC的应用与发展
2.3.1在图书馆界的广泛应用
2.3.2网络环境下MARC标准的扩充
2.4 CNMARC档案信息的处理
2.4.1档案界MARC的现状和实践
2.4.2 CNMARC AMC系统开发概述
2.5领域的其他元数据比较研究
2.5.1 DC元数据与CNMARC核心元素集
2.5.2 EAD元数据与CNMARC多级结构
2.6小结
第三章基于XML的MARC信息描述机制研究
3.1 MARC信息描述的优势和局限
3.1.1信息的描述与格式
3.1.2信息的存储与交换
3.1.3信息的加工与处理
3.1.4信息的检索与发布
3.2 XMARC信息描述的理论研究
3.2.1 MARC与XML
3.2.2 XML DTD与XML SCHEMA
3.2.3基于XML DTD的CNMARC信息描述
3.2.4基于XML SCHEMA的CNMARC信息描述
3.3 XMARC信息描述的实践研究
3.3.1基于XMARC资源描述框架的DTD设计
3.3.2基于XMARC资源描述框架的SCHEMA设计
3.3.3基于XML SCHEMA的CNMARC核心元素集设计
3.3.4 MARC对XMARC的信息映射
3.4小结
第四章主题概念词义关系及其转换的研究与构建
4.1主题概念与主题词表
4.1.1主题词的语义性
4.1.2主题词表的体系结构
4.2主题词表的知识表示
4.3主题词语义关系的组织与实现
4.3.1词表数据的预处理
4.3.2主题词语义关系的组织
4.3.3主题范畴索引的生成
4.3.4主题词族索引的生成
4.4 K-S-C主题概念知识库方法
4.4.1基于中文词概念的K-S-C知识关系结构
4.4.2基于词素相似度的主题知识转换方法
4.5小结
第五章基于XMARC的主题知识自动标引研究
5.1中文信息自动标引的方法与技术
5.1.1信息标引的理论基础
5.1.2中文信息自动标引研究进展
5.2基于K-S-C语义关系的自动标引
5.2.1面向主题标引的切词和抽词方法
5.2.2预处理特义中文禁用字词的切分算法SWF
5.2.3长词匹配短词回溯的中文抽词标引算法EMM
5.3 XMARC主题信息的标引挖掘技术
5.3.1 XMARC的主题知识标引
5.3.2 XMARC文档的关系存储
5.3.3 XMARC主题块信息的标引挖掘
5.4小结
第六章基于XMARC的主题分类概念检索研究
6.1中文信息的概念检索
6.1.1信息检索的理论基础
6.1.2中文信息的概念检索
6.2基于K-S-C语义关系的概念检索
6.2.1基于主题知识的概念信息检索
6.2.2 K-S-C检索研究及其主题范畴模式抽取
6.2.3主题语义词素相似度及其匹配算法
6.3 XMARC主题分类概念的检索
6.3.1基于主题知识标引的XMARC词句概念检索
6.3.2基于抽取范畴模式XMARC分类概念检索
6.4实验结果
6.4.1评价指标
6.4.2实验环境
6.4.3实验内容
6.4.4实验结论
6.5小结
第七章总结与展望
参考文献
附录
攻读学位期间发表的学术论文目录
致谢