文摘
英文文摘
声明
第1章 绪论
1.1研究背景及意义
1.2研究现状
1.2.1国内外研究现状
1.2.2当前研究重点问题
1.3本文的研究工作及组织
第2章 文本分类技术概况
2.1文本分类的基本概念
2.2文本分类的一般过程
2.3文本预处理
2.3.1中文分词
2.3.2中文词性标注
2.4文本表示
2.4.1特征项的选择
2.4.2布尔模型
2.4.3向量空间模型
2.5特征选取
2.6权重计算
2.7文本分类方法
2.7.1 k-近邻方法
2.7.2支持向量机方法
2.8本章小结
第3章 基本短语的识别
3.1特征项类型的比较
3.2基本短语的界定和语义分析
3.2.1基本名词短语的界定
3.2.2基本动词短语的界定
3.2.3基本短语的语义分析
3.3基本短语的分析流程
3.4基本短语识别的实现
3.5实验结果与分析
3.6本章小结
第4章 基于词和基本短语模式的中文文本分类方法
4.1基于词和基本短语模式的中文文本分类方法的实现
4.2文本预处理
4.3停用词处理和语义的消歧
4.3.1停用词的处理
4.3.2语义的消歧
4.4特征选取
4.5权重计算方法的改进
4.6实验评估函数
4.7实验结果及分析
4.7.1实验数据
4.7.2实验结果及分析
4.8本章小结
第5章 结论与展望
5.1结论
5.2展望
参考文献
攻读硕士期间发表论文情况
致谢