基于支持向量机的新闻自动分类技术的研究与应用

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

随着网络信息的迅猛发展,信息处理已经成为人们获取有用信息不可缺少的工具,文本自动分类系统是信息处理的重要研究方向,它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程。利用文本自动分类技术,可以快速地处理大规模的文本数据,大大地提高信息的可用性和利用率。目前,文本分类系统大多采用统计和机器学习的方法,这类方法在语义的水平上来分析文本内容,判断其相似度,从而得到类别划分。
　　本文在对文本分类理论了解的基础上,对基于统计学习理论的支持向量机理论进行了深入的研究和探讨,然后提出了基于双词典的改进型双向最大匹配算法和基于动态表的停用词消除算法,这两个算法有效地提高了文本预处理的正确率,去掉了绝大多数无用的词项,使得表达文档特征的向量更准确。通过在文本预处理阶段提高预处理结果的准确性,尽量减少能够影响分类精度的文档噪声,提高SVM分类器输入的准确性,使得SVM分类器能够得到尽可能准确的结果。
　　本文还提出了基于改进型多项式核的SVM多类分类算法,该算法比较好地解决了多类文本分类的问题,同时有效地利用了人工添加的类别,在较少的时间内可以完成整个训练和分类工作。最后结合这三个算法完整地设计和实现了一个新闻自动分类系统,并给出了评估方法和实验结果。

著录项

作者
易潇;
展开▼
作者单位

东北大学;

展开▼
授予单位东北大学;
学科计算机应用技术
授予学位硕士
导师姓名张斌;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;信息处理（信息加工）;
关键词
文本分类; 支持向量机; 分类器; 新闻自动分类; 信息处理;

相似文献

中文文献
外文文献
专利

1. IPC自动分类技术的研究与应用——辅助自动分类的算法实现 [J] . 吴宏洲 . 电脑知识与技术 . 2015,第033期
2. 基于半监督支持向量机的期刊收稿系统自动分类方法 [J] . 耿晓军 . 现代电子技术 . 2018,第024期
3. 基于支持向量机的学位论文自动分类研究 [J] . 赵国荣 . 晋图学刊 . 2016,第004期
4. 基于支持向量机的多类文本自动分类方法研究 [J] . 李琼 ,董燕燕 . 汉口学院学报 . 2013,第002期
5. 基于一对一支持向量机的视频自动分类算法 [J] . 覃丹 ,蒋兴浩 ,孙锬锋 . 计算机应用与软件 . 2010,第001期
6. 基于支持向量机的医学期刊文章自动分类研究 [C] . 王东波 ,苏新宁 ,朱丹浩 . 第二十四届全国计算机信息管理学术研讨会 . 2010
7. 基于支持向量机的文本自动分类器的研究与应用 [A] . 黄瑜青 . 2012

基于支持向量机的新闻自动分类技术的研究与应用

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅