基于改进KNN分类算法的文本分类关键技术研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着信息处理技术和计算机网络的普及，Internet上的Web页面数量呈指数增长，为了快速、方便地处理这些信息，Web文本自动分类技术应运而生，并且已经成为信息检索和文本数据挖掘领域的一个研究热点。
　　结合在企业竞争情报系统中的应用，本文提出了新的特征选择函数并且对KNN算法做了改进，具体的工作如下：
　　(1)介绍了文本挖掘中所用到的主要关键技术，包括：中文分词技术、文本的特征表示、文本的特征选择、分类技术、聚类技术，以及一些性能评估方法。
　　(2)介绍了KNN算法的步骤、优缺点，着重介绍了两方面的改进方法。第一个改进特征选择函数，引入词频、文档频、信息熵等元素后，信息选择函数对词的重要性有较好的区分度，既有较好的类内代表性，又有较好的类间区分度。第二个改进的是 KNN分类算法，根据KNN分类算法常常遇到的问题，提出了对样本空间的裁剪方法，不但提高了精度，又减少了时间复杂度。
　　最后，在前面研究的基础上，根据所做的项目课题，将改进的KNN算法应用于企业竞争情报系统中，取得了较好的结果。

著录项

作者
袁通;
展开▼
作者单位

西安电子科技大学;

展开▼
授予单位西安电子科技大学;
学科计算机应用技术
授予学位硕士
导师姓名刘志镜;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言 ; 文字信息处理 ;
关键词
文本分类; KNN算法; 特征选择函数; 最大类内空间;

相似文献

中文文献
外文文献
专利

1. 基于类别特征改进的KNN短文本分类算法 [J] . 黄贤英 ,熊李媛 ,刘英涛 . 计算机工程与科学 . 2018 ,第001期
2. 基于搜索改进的KNN文本分类算法 [J] . 殷亚博 ,杨文忠 ,杨慧婷 . 计算机工程与设计 . 2018 ,第9期
3. 基于K-Medoids聚类的改进KNN文本分类算法 [J] . 罗贤锋 ,祝胜林 ,陈泽健 . 计算机工程与设计 . 2014 ,第011期
4. 基于DBSCAN聚类的改进KNN文本分类算法 [J] . 苟和平 ,景永霞 ,冯百明 . 科学技术与工程 . 2013 ,第001期
5. 一种基于密度的改进KNN文本分类算法 [J] . 茅剑 ,刘晋明 ,曹勇 . 漳州师范学院学报（自然科学版） . 2012 ,第002期
6. 基于加权修正的KNN文本分类算法 [C] . . 第二十五届中国数据库学术会议(NDBC2008) . 2008
7. 基于KNN的文本分类特征选择与分类算法的研究与改进 [A] . 黄娟娟 . 2014

基于改进KNN分类算法的文本分类关键技术研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅