基于内容的Web新闻文本自动分类问题研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着WWW的迅速发展和普及，人们已经从信息资源匮乏的时代迅速过渡到信息极为丰富的数字化时代。面对网上海量的信息资源，人们很难迅速有效的找到所需的信息。因此，如何合理和有效地组织和管理网上信息，已经成为Web智能领域里一个十分重要的研究课题。随着网络信息的大量增长，传统的人工处理网络信息的方式已不能适应时代的需要。网络上的信息大都以文本形式出现。因此，Web文本的自动分类研究成为了一个日益重要的研究领域。
　　本文的研究内容主要有以下几个方面：
　　（1）分析了Web 文本分类中的特征表示、特征项提取、分类方法等关键技术，探讨和研究了存在的难点和突出问题。
　　（2）提出了规则和统计相结合的中文命名实体识别方法。提出了一种在构造外部和内部规则的同时采用概率统计的中文命名实体的识别方法，实验结果表明，该方法可以获得较高的准确率和召回率。
　　（3）讨论了Web 新闻文本中的新闻实体要素对其主题的限定作用。并以这些新闻实体要素的组合为特征，对Web 新闻文本进行主题分类。实验结果表明，该方法获得了较好的主题识别效果。
　　（4）提出一种利用新闻新闻实体要素作为特征来表示Web 新闻文本的模型——SNE模型，在此基础上，构建了分类器。实验结果表明，建立在该模型基础上的新闻实体要素组合的Web 新闻文本的主题分类方法可以达到较好的分类效果。

著录项

作者
潘正高;
展开▼
作者单位

合肥工业大学;

展开▼
授予单位合肥工业大学;
学科计算机应用技术
授予学位硕士
导师姓名胡学钢;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算机情报检索系统;
关键词
Web新闻文本; 自动分类; 网络信息;

相似文献

中文文献
外文文献
专利

1. 基于朴素贝叶斯Web新闻内容的抽取方法 [J] . 罗永莲 ,赵昌垣 ,贾玉芳 . 计算机与现代化 . 2016,第001期
2. 基于标签路径特征融合的在线Web新闻内容抽取 [J] . 吴共庆 ,胡骏 ,李莉 . 软件学报 . 2016,第003期
3. 基于WEB新闻内容的信息抽取方法研究 [J] . 沈娜 . 江西科技学院学报 . 2015,第003期
4. 基于语义的Web新闻内容倾向性分析框架 [J] . 申晓晔 ,封化民 ,毋非 . 郑州大学学报（理学版） . 2009,第001期
5. 一种改进的基于Web的新闻视频内容语义分析方法 [J] . 焦黎冰 ,封化民 ,何文才 . 江西师范大学学报（自然科学版） . 2008,第002期
6. 一种改进的基于Web的新闻视频内容语义分析方法 [C] . 焦黎冰 ,封化民 ,西安电子科技大学通信工程学院 . 第六届全国搜索引擎和网上信息挖掘学术研讨会 . 2008
7. 基于进化模糊规则的Web新闻内容分类技术研究 [A] . 桂洋 . 2019

基于内容的Web新闻文本自动分类问题研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅