文摘
英文文摘
第1章 绪 论
1.1 论文研究目的和意义
1.2 国内外研究和发展现状
1.3 论文的研究内容和结构安排
第2章 基于VSM真实语料的文本分类方法
2.1 文本表示
2.1.1 分词
2.1.2 文档特征
2.1-3 VSM模型
2.1.4 特征项权重的计算方法
2.2 构建VSM的特征
2.2.1 文档频率
2.2.2 互信息
2.2.3 CHI统计量
2.2.4 权重排序
2.2.5 期望交叉嫡
2.3 文本分类方法
2.3.1 贝叶斯方法
2.3.2 Rocchio算法
2.2.3 k近邻算法
2.3.4 支持向量机算法(SVM)
2.4 本章小结
第3章 语义在文本分类中的应用
3.1 概念词典的建立
3.1.1 知网简介
3.1.2 义原
3.1.3 建立概念词典
3.2 语义在文本中的应用
3.2.1 文本的语义特征向量表示
3.2.2 基于语义的分类
3.3 本章小结
第4章 基于语义扩展VSM的文本分类方法
4.1 预处理
4.2 创建原始空间向量模型
4.2.1 TFIDF
4.2.2 获得类中心向量
4.3 语义重构VSM模型
4.3.1 计算义原权值
4.3.2 提取特征义原算法
4.3.3 扩展特征向量
4.3.4 对同义词的处理
4.3.5 VSM模型的融合
4.4 进行分类
4.5 阈值的确定
4.6 本章小结
第5章 实验过程与结果分析
5.1 实验环境
5.1.1 实验语料
5.1.2 分词系统
5.2 评估指标
5.3 实验过程
5.4 实验结果与分析
5.4.1 不同特征选择算法构建VSM对分类的影响
5.4.2 VSM维数对分类的影响
5.4.3 基于扩展VSM的文本分类
5.5 本章小结
结 论
参考文献
攻读硕士学位期间发表的论文和取得的科研成果
致 谢