封面
声明
中文摘要
英文摘要
目录
第一章 绪论
1.1研究背景与意义
1.2搜索引擎的概述
1.3垂直搜索引擎的现状与发展
1.4论文的相关工作
第二章 垂直搜索引擎的相关技术
2.1页面下载技术
2.2网页信息结构化
2.3中文分词
2.4信息索引技术
2.5网页搜索结果排序技术
2.6本章小结
第三章 基于改进型Shark-Search算法的聚焦网络爬虫
3.1聚焦网络爬虫
3.2基于网页内容分析的算法
3.3基于链接聚类与隧道技术的Shark-Search算法的改进
3.4聚焦网络爬虫评价指标
3.5实验结果与分析
3.6本章小结
第四章 基于概率模型与词性标注的命名实体识别
4.1中文分词的技术难点
4.2中文分词算法介绍
4.3隐马尔可夫与词性标注
4.4中文分词的评测标准
4.5实验结果与分析
4.6本章小结
第五章 房地产垂直搜索引擎的设计与实现
5.1系统的开发环境
5.2设计思想
5.3系统的体系结构及业务流程
5.4系统各个模块的实现
5.5关键配置信息
5.6实验结果及分析
5.7本章小结
第六章 总结与展望
6.1本文总结
6.2未来工作展望
致谢
参考文献
附录