首页> 中文学位 >分层式文本分类及其在新闻推荐系统中的应用
【6h】

分层式文本分类及其在新闻推荐系统中的应用

代理获取

目录

声明

摘要

第1章 绪论

1.1 信息过载问题

1.2 研究动机

1.3 实现方法

1.4 文章构成

第2章 现有文本分类的相关研究

2.1 在机器学习中的文本分析的背景

2.2 文本分类中的特征选择办法

2.2.1 新闻频阙值

2.2.2 信息增益

2.2.3 互信息

2.2.4 X2统计量法

2.2.5 术语强度

2.3 基于分类器的文本分类方法

2.3.1 Rocchio算法

2.3.2 朴素贝叶斯算法

2.3.3 KNN算法

2.3.4 神经网络算法

第3章 分层文本分类的研究

3.1 分层文本分类模型

3.1.1 词性标注(Part-of-Speech Tagger)

3.1.2 获取词干(Stemmer)

3.1.3 停词过滤(Stop-Word Filter)

3.1.4 特征选择(Feature Selection)

3.1.5 分层神经网络分类器(Hierarchical Neural-based Classifier)

第4章 分层文本分类在智能新闻推荐系统中应用

4.1 INRA的结构

4.1.1 用户界面

4.1.2 系统数据库

4.1.3 词法分析

4.1.4 INRA引擎

4.1.5 HTC引擎

第5章 实验设计和分析

5.1 语料库

5.1.1 新闻

5.1.2 文件格式

5.1.3 新闻内部标签

5.1.4 分类

5.1.5 分类的层次结构

5.2 特征选择分析

5.3 基于分层的自动文本分类

5.4 智能新闻推荐系统的性能

5.5 与其他推荐系统的比较

第6章 结论和展望

6.1 结论

6.2 未来展望

参考文献

致谢

展开▼

摘要

智能信息推荐,因其可以广泛的应用到各种信息系统中,有效解决面对海量信息的尴尬,以及建立起适应性的个性化的应用系统,而受到研究者和应用单位的广泛的关注。本研究以新闻数据的应用为背景,试图找到一种有效的文本分类方法,以建立智能推荐系统,使其可以根据用户的个人兴趣来定位并推荐相关的新闻资料。
  论文在分析了相关的文本分类技术以及推荐系统研究现状,尤其是关于特征选取办法相关研究和基于分类器的文本分类技术的研究,以及分析了应用于个性化推荐系统的设计和实现的案例。在此基础上,论文将将传统的基于内容的过滤法则与以分层式文本分类相结合,取长补短,充分利用基于内容的过滤的优势,减轻矩阵稀疏度和早期级别问题的影响。并且利用分层式文本分类技术,克服了基于内容过滤无法分析内容的问题。以此构建的新闻推荐系统,降低用户迷失在海量网络资源中的可能性,使他们能够快速准确地定位自己需要的内容,提高网站的运行效率,提高用户的兴趣。
  实验结果证明本论文所提出的方法的确能产生有效的推荐,试验中将本文提出的方法其他的现有若干典型推荐方法进行了比较,并从分层式的文本分类工作和推荐的进程两方面对未来的研究提出建议。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号