文摘
英文文摘
第一章 引言
1.1研究背景与意义
1.2数字图书馆概述
1.2.1数字图书馆的起源
1.2.2数字图书馆的特征
1.3数字图书馆的研究现状及发展
1.4数字图书馆文本资料的分类
1.5主要研究内容
1.6本文的组织
第二章 文本分类综述
2.1文本分类的定义
2.2文本分类的模型
2.3文本预处理
2.3.1文档表示模型
2.3.2特征提取
2.3.3特征空间降维
2.3.4降维策略
2.3.5降维方法总结
2.4分类算法
2.4.1朴素贝叶斯
2.4.2 kNN
2.4.3支持向量机
2.5分类质量性能评估
2.5.1查准率与查全率
2.5.2F1标准
2.6小结
第三章 自学习文本分类系统的设计与实现
3.1系统设计
3.1.1文档预处理模块
3.1.2训练分类器模块
3.1.3分类模块
3.2系统实现
3.2.1文档预处理模块实现
3.2.2训练分类器模块实现
3.2.3分类模块实现
3.3实验分析
3.4小结
第四章 数字图书馆文本文献元数据自动标注
4.1元数据
4.1.1元数据特点
4.1.2元数据结构
4.1.3 Dublin Core元数据
4.1.4论文文献元数据
4.2元数据抽取策略
4.3元数据抽取规则
4.3.1页眉信息抽取
4.3.2标题信息抽取
4.3.3作者信息抽取
4.3.4摘要信息抽取
4.3.5关键字信息抽取
4.3.6引文信息抽取
4.4论文文献元数据自动抽取
4.4.1元数据自动抽取实施
4.4.2元数据自动抽取实验评测
4.5小结
第五章 元数据管理
5.1本体的定义与内涵
5.1.1本体的概念
5.1.2本体的类型
5.2本体论的研究进展
5.2.1国外主要研究现状
5.2.2国内主要研究现状
5.2.3国内外重要的本体系统
5.3本体表示语言
5.3.1 RDF和RDF-S
5.3.2 DAML和OIL
5.3.3 OWL
5.4本体构建方法
5.4.1骨架法
5.4.2 IDEF5
5.4.3七步法
5.5元数据本体构建
5.5.1 Protégé
5.5.2构建元数据本体
5.6小结
第六章 总结与展望
6.1总结
6.2展望
致谢
附录A 中国国家图书馆分类法
附录B 攻读硕士学位期间发表论文列表
附录C 攻读硕士学位期间参加学术会议列表
参考文献