文摘
英文文摘
论文说明:图表目录
声明
致谢
第一章 绪论
1.1课题来源
1.2课题研究背景和意义
1.3本课题的理论处理基础-自然语言处理技术
1.4本文主要研究内容及组织结构
第二章 关键词提取背景及相关工作
2.1引言
2.2关键词概念
2.3语言学背景知识-自然语言处理技术
2.3.1自然语言处理概述
2.3.2自然语言处理的研究方法
2.4聚类分析
2.4.1聚类分析概述
2.4.2聚类分析中的数据类型
2.4.3主要聚类方法概述
2.5互联网关键词提取技术研究现状
2.5.1网页中文本关键词提取技术
2.5.2网页信息提取的评价指标
2.5.3文本主题词的提取研究现状
2.6本章小结
第三章 基于层次聚类的中文新闻网页关键词提取的研究
3.1引言
3.2语义相似度
3.3候选关键词
3.4聚类距离的计算
3.5基于层次聚类的中文新闻网页关键词提取算法
3.6实验与评价
3.6.1测试集与评价标准
3.6.2语义相似度阈值的设定
3.6.3实验与评价
3.7本章小结
第四章 基于密度聚类的中文新闻网页关键词提取研究
4.1引言
4.2词共现模型
4.3算法步骤描述
4.3.1算法流程
4.3.2算法步骤描述
4.3.3算法图示说明
4.5实验与评价
4.5.1词共现阈值对实验结果的影响
4.5.2实验结果分析
4.6本章小结
第五章 结束语
5.1本文总结
5.2工作展望
参考文献
攻读硕士学位期间参加研究的课题和发表的论文