文摘
英文文摘
论文说明:图、表目录
中国科学技术大学学位论文相关声明
第一章引言
1.1研究背景
1.2文本分类技术的发展
1.3目前文本分类方法存在的不足
1.4命名实体的引入
1.5本文主要工作和贡献
1.6论文组织结构
第二章文本分类概述及相关技术
2.1文本自动分类问题的一般描述
2.1.1获取训练文档集
2.1.2建立文档表示模型
2.1.3获得文档特征
2.1.4分类模型的建立
2.1.5分类性能评测
2.2特征选择和提取
2.2.1文本的特征选择
2.2.2常用特征选择方法
2.3常用分类算法
2.3.1简单向量距离分类法
2.3.2 KNN(K最近邻居)算法
2.3.3贝叶斯分类法
2.3.4基于投票的方法
2.3.5其它分类方法
第三章命名实体识别
3.1信息抽取
3.2命名实体识别问题的一般描述
3.3常用命名实体识别方法
3.3.1方法优缺点比较
3.3.2隐马尔科夫模型HMM
3.3.3 Viterbi算法
3.4命名实体识别系统描述及实验分析
3.4.1系统描述
3.4.2单词特征处理
3.4.3实验结果及分析
3.5本章小结
第四章基于支持向量机的文本分类
4.1支持向量机及其工作原理
4.1.1线性支持向量机
4.1.2非线性支持向量机
4.2基于SVM的文本分类
4.2.1文本分类中的SVM
4.2.2文本分类框架
4.3实验结果及分析
第五章集成命名实体的特征选择
5.1文本分类中命名实体的引入
5.2集成命名实体的特征选择方法
5.2.1主要思想
5.2.2算法描述
5.2.3集成命名实体的分类系统设计与实现
5.3实验及结果分析
5.4本章小结
第六章结论与工作展望
6.1结论
6.2进一步的工作
参考文献
致谢
攻读硕士学位期间的科研工作