不完备信息系统处理技术及其在文本分类中的应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着网络技术的飞速发展与普及，信息处理已经成为人们获取有用信息不可缺少的工具，而文本自动分类则是信息处理的重要研究方向。当前的文本分类方法主要有基于概率的统计分类方法、基于机器学习的分类方法。无论采用哪一种分类方法，都要面对一个首要的问题：如何处理文本中分词处理后数量庞大的文本特征项。在文本分类中，文本特征向量通常高达几千甚至上万维，这给整个分类过程带来了相当庞大的计算量，不仅影响到文本分类的效能，而且在很大程度上影响着分类算法的应用推广。因此，进行有效的降维处理是非常重要的。粗糙集理论是一种新的处理模糊和不确定知识的软计算工具。它能有效地分析和处理不精确、不一致、不完整等各种不完备信息，并从中发现隐含的知识，揭示潜在的规律，近年来在机器学习、数据挖掘等多个领域得到广泛应用。本文详细阐述了粗糙集中的不完备信息系统处理技术，并结合文本分类的特点，给出了一个基于粗糙集属性约简的文本分类解决方案，主要创新点如下： 1.采用概率统计方法，根据文本属性在不同文本、不同类别中的重要性与分布情况对其进行筛选和排序； 2.结合文本分类的特点，提出了适用于文本分类的一种量化容差关系和启发式的属性约简算法； 3.整个实验系统构建在数据库端，数据以表的形式、算法以存储过程的形式存储在服务器内，能轻易的扩展到网络与分布式协同计算方式。本文从上面几点出发，构建了一个完整的网络文本自动分类系统。经过封闭式和开放式实验测试，表明系统能够较好地进行文档特征项的特征提取并且大幅度的降低了整个文本分类的时间代价。为粗糙集理论的实际应用与文本分类技术的进一步发展提供了一个好的研究样例。

著录项

作者
代劲;
展开▼
作者单位

重庆邮电大学;

展开▼
授予单位重庆邮电大学;
学科计算机应用技术
授予学位硕士
导师姓名王国胤;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类信息处理（信息加工）;
关键词
粗糙集; 不完备信息系统; 属性约简; 文本分类; 网络技术;
入库时间 2022-08-17 10:14:31

相似文献

中文文献
外文文献
专利

1. 基于不完备信息系统的文本分类研究与应用 [J] . 代劲 ,胡峰 ,王国胤 . 重庆邮电大学学报（自然科学版） . 2006,第003期
2. 自动文本分类中的智能处理技术 [J] . 孙晋文 ,肖建国 . 计算机科学 . 2003,第008期
3. 不完备信息系统在农业生物灾害中的应用 [J] . 阳淯 . 科技信息 . 2013,第011期
4. 不完备信息系统知识获取方法在桥梁养护决策中的应用 [J] . 邹艳 ,杨丹 . 计算机与现代化 . 2010,第007期
5. 一种新的Rough集方法在不完备信息系统中的应用 [J] . 王丽菊 ,杨国明 . 电脑知识与技术 . 2007,第018期
6. 文本分类在商品广告分类中的应用 [C] . 罗勇 ,周超 ,许超 . 第五届信号和智能信息处理与应用学术会议 . 2011
7. 粗糙集在不完备信息系统数据挖掘中的应用研究 [A] . 申爱华 . 2004

不完备信息系统处理技术及其在文本分类中的应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅