文摘
英文文摘
声明
第一章引言
第一节研究背景
1.1.1基于网页的关键词提取技术研究背景
1.1.2基于网页的广告关键词提取技术研究背景
第二节基于网页的关键词提取技术及其发展现状
1.2.1基于网页关键词提取技术理论基础
1.2.2基于网页的广告词关键词提取技术的发展现状
第三节本文立意与安排
第二章基于网页的广告关键词提取技术及实现
第一节AdsKEX系统结构
2.1.1 AdsKEX系统框架图
2.1.2 AdsKEX系统组成
第二节AdsKEX系统中的关键词提取技术
2.2.1 Html解析
2.2.2预处理
2.2.3关键词提取
2.2.4排名
2.2.5小结
第三章改进的AdsKEX系统设计与实现
第一节基于MainBlock的关键词提取技术
3.1.1 MainBlock的提出
3.1.2 Block分类方法
3.1.3分类器的选取
3.1.4 Block属性的选取
3.1.5网页Block分类实现
3.1.6训练数据模型
3.1.7 Decision Tree模型的错误率估计
3.1.8基于主观规则的MainBlock算法改进
第二节基于关键词细特征的改进
3.2.1关键词细特征的选取
3.2.2机器学习算法的选择
3.2.3关键词细特征的提取实现
第四章改进算法的实验
第一节实验的实现
4.1.1数据网页收集的标准
4.1.2对网页进行标记
4.1.3训练权重
4.1.4准确率计算
第二节实验结果分析
4.2.1训练权重
4.2.2 Top-n测试结果
4.2.3实验结论
第五章总结与展望
参考文献
致谢