文摘
英文文摘
致谢
第一章绪论
1.1引言
1.2国内外相关研究
1.2.1新一代搜索引擎Google
1.2.2 WWW比较购物代理ShopBot
1.2.3基于概念的信息检索
1.2.4基于聚类的检索
1.3本文研究内容及创新之处
1.4论文内容组织
第二章WWW半结构化模型及其算法
2.1超文本标注语言HTML
2.2半结构化数据模型OEM
2.3网页结构提取算法
2.3.1存储结构
2.3.2构造树结构基本算法
2.3.3网页树型结构的调整与增强
2.4小结
第三章基于主题的启发式智能搜索
3.1智能搜索问题
3.2搜索算法的特点
3.3启发式搜索算法
3.3.1专业词汇集(Domain Lexicon)
3.3.2网页评价函数Value()
3.3.3目标网页判定IsTarget()
3.3.4算法
3.4中文分词方法
3.4.1增量匹配算法及其数据结构
3.4.2中文分词辅助处理
3.5小结
第四章信息的智能抽取方法
4.1信息抽取问题
4.2自动文摘问题
4.3数据对象抽取问题
4.3.1基于规范说明的抽取方法
4.3.2自动的抽取方法
4.3.3启发式的抽取方法
4.4小结
附注:PAC分析
第五章Agent技术与互联网
5.1 Agent定义
5.2关于Agent的思考
5.3 Agent的特征
5.4 Agent的分类
5.5 Agent与对象(Object)
5.6 MultiAgent系统
5.7 Agent技术在互联网上的应用
5.8小结
第六章实验系统的设计与实现
6.1手机比价器实验系统
6.1.1实验系统开发背景
6.1.2实验系统体系结构
6.1.3 IsMobile的设计
6.1.4实验结果
6.2股评智能搜索实验系统
6.2.1功能介绍
6.2.2使用说明
6.3网页结构提取工具
第七章工作总结
7.1工作总结
7.2未来的工作
参考文献
附录读研期间发表的论文