声明
摘要
第1章 绪论
1.1 信息过载问题
1.2 研究动机
1.3 实现方法
1.4 文章构成
第2章 现有文本分类的相关研究
2.1 在机器学习中的文本分析的背景
2.2 文本分类中的特征选择办法
2.2.1 新闻频阙值
2.2.2 信息增益
2.2.3 互信息
2.2.4 X2统计量法
2.2.5 术语强度
2.3 基于分类器的文本分类方法
2.3.1 Rocchio算法
2.3.2 朴素贝叶斯算法
2.3.3 KNN算法
2.3.4 神经网络算法
第3章 分层文本分类的研究
3.1 分层文本分类模型
3.1.1 词性标注(Part-of-Speech Tagger)
3.1.2 获取词干(Stemmer)
3.1.3 停词过滤(Stop-Word Filter)
3.1.4 特征选择(Feature Selection)
3.1.5 分层神经网络分类器(Hierarchical Neural-based Classifier)
第4章 分层文本分类在智能新闻推荐系统中应用
4.1 INRA的结构
4.1.1 用户界面
4.1.2 系统数据库
4.1.3 词法分析
4.1.4 INRA引擎
4.1.5 HTC引擎
第5章 实验设计和分析
5.1 语料库
5.1.1 新闻
5.1.2 文件格式
5.1.3 新闻内部标签
5.1.4 分类
5.1.5 分类的层次结构
5.2 特征选择分析
5.3 基于分层的自动文本分类
5.4 智能新闻推荐系统的性能
5.5 与其他推荐系统的比较
第6章 结论和展望
6.1 结论
6.2 未来展望
参考文献
致谢