摘要
第一章背景与概述
1.1大规模科学数据共享
1.2中医药科技数据库群的集成与共享
1.3技术背景
1.3.1互联网技术及其研究现状分析
1.3.2分布式数据库技术及其研究现状分析
1.3.3本体论与RDF简介
1.4全文检索技术与lucene简介
1.4.1 lucene的基本情况
1.4.2全文检索的实现机制
1.4.3亚洲语言的切分词问题(Word Segment)
第二章基于DartGrid V3的数据检索解决方案
2.1现有查询系统的问题与设计目标
2.2解决异质异构数据库集成的设计思想
2.3 DartGri d V3的设计理念与简介
2.3.1 DartGrid定义与目标
2.3.2 DartGrid的工作原理
2.4基于DartGridV3的解决方案
2.5解决方案的组成
2.5.1 DartGrid V3内核
2.5.2基于DartGrid V3的Web查询平台-DartGrid V3 Web Console
2.5.3基于语义的数据库全文检索系统—DartSearch
2.5.4从全文检索系统中分离出来的树状词库中文分词算法—DartSplitter
第三章基于DartGrid V3的Web查询平台--DartGrid V3 Web Console
3.1 DartGrid V3 Web Console的功能及要求
3.2 DartGrid V3 Web Console的分层体系架构
3.3 DartGrid V3 Web Console的核心设计
第四章基于语义的数据库全文检索系统--DartSearch
4.1 DartSearch特有的设计需求与难点
4.2 DartSearch的解决方案
4.3 DartSearch的架构设计与实现
4.4 DartSearch查询界面展示
第五章树状词库中文分词算法--DartSplitter
5.1中文分词概述
5.2最大匹配法及缺陷
5.2.1最大匹配法分词的理念与处理过程
5.2.2最大匹配法分词的缺陷
5.3 DartSplitter的设计思想与算法
5.3.1 DartSplitter的设计目标
5.3.2算法的突破口—词库
5.3.3 DartSplitter的算法设计
5.3.4 DartSplitter的实现细节
5.3.5 DartSplitter的实验结果
第六章总结与展望
6.1全文总结
6.2工作展望
参考文献
攻读硕士期间发表论文及参加项目情况
致谢