文摘
英文文摘
声明
第一章绪论
1.1研究背景与意义
1.2文本聚类技术的研究现状
1.2.1国外文本聚类技术研究现状
1.2.2国内文本聚类技术研究现状
1.3本体的发展状况
1.4本文的研究内容和组织结构
第二章文本聚类技术
2.1文本聚类的概念
2.2文本的表示
2.2.1预处理
2.2.2文本表示模型
2.2.3文本相似度计算
2.2.4文本特征选择
2.3聚类算法
2.3.1划分方法
2.3.2层次方法
2.3.3基于简单贝叶斯方法
2.3.4基于K-最近邻参照聚类方法
2.3.5基于蚁群的聚类方法
2.3.6基于SOM神经网络的方法
2.4本章小结
第三章本体论
3.1本体的定义
3.1.1本体论的哲学意义
3.1.2本体论的发展
3.1.3本体的定义
3.2本体的构成
3.3本体的研究现状
3.3.1 CYC
3.3.2 WordNet--网上英语在线词典
3.3.3 MindNet
3.3.4盘古常识库简介
3.3.5国家知识基础设施(NKI)简介
3.4本体的分类
3.5本体的作用
3.6本体的主要应用领域
3.6.1电子商务
3.6.2知识管理
3.7.本章小结
第四章基于主题概念聚类的中文文本聚类
4.1问题的提出
4.2 HOWNET本体库
4.3基于主题概念聚类的文本聚类
4.3.1表示文档内容的概念生成
4.3.2主题概念聚类
4.3.3基于主题概念聚类的文本聚类
4.4算法时间复杂度分析
第五章总结和展望
参考文献
致谢
攻读学位期间所发表的学术论文