基于SVM的WEB中文文本分类系统研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近几年来,我国的互联网处于飞速发展之中,计算机的使用也不断普及,互联网上出现了海量的信息资源。如何管理、获取这些资源成为了一个极具挑战性的问题。就国内的现状而言,互联网上的信息多数是以中文Web文本的形式存储、展示的。针对中文Web文本的自动分类系统,由于其在解决获取、管理互联网信息资源中的重要意义,而受到了广泛的关注。
　　不同于印欧语系语言,中文由于其独特的特性决定,其特征词之间并没有明显的分界线,且相同长度文字之中的信息量也远大于印欧语系语言,因而在对中文Web文本分类的过程中,首先必须使用一种合理有效的方式表示文本并提取特征信息,其次才能根据这些信息进行分类。因而中文Web文本的表示模型与分类算法一起,成为中文分类系统中的两个关键问题。
　　本文介绍了中文Web文本分类的相关背景技术,研究与讨论了经典TF-IDF信息检索模型和、LSA语义信息检索模型和LDA概率主题检索模型在中文文本分类技术中的应用,研究并分析了现有的基于支持向量机的分类算法的优缺点。之后实现了使用上述三种检索模型的基于支持向量机的文本分类算法。使用公开的数据对系统进行了测试。对基于上述三种模型的分类结果进行了分析和比对,提出了可以在准确率和时间上权衡的Web中文文本分类系统,并通过实验验证了该系统的正确性和实用价值。

著录项

作者
刘佳;
展开▼
作者单位

西安电子科技大学;

展开▼
授予单位西安电子科技大学;
学科计算机系统结构
授予学位硕士
导师姓名王凯东;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
中文文本分类; 支持向量机; Web文本; 检索模型; 系统设计;

相似文献

中文文献
外文文献
专利

1. 基于SVM的中文文本分类系统的设计与实现 [J] . 张昭楠 . 电子设计工程 . 2016,第016期
2. 基于SVM藏文文本分类的研究与实现 [J] . 贾宏云 ,群诺 ,苏慧婧 . 电子技术与软件工程 . 2018,第009期
3. 基于中心核对齐模糊SVM的中文农业文本分类 [J] . 卢鸿 ,邱云志 ,戴小路 . 赣南师范大学学报 . 2021,第006期
4. 基于SA-SVM的中文文本分类研究 [J] . 郭超磊 ,陈军华 . 计算机应用与软件 . 2019,第003期
5. 基于特征选择的M-SVM中文文本分类 [J] . 刘永芬 ,程丽 ,陈志安 . 软件 . 2019,第009期
6. 基于Biased SVMs的中文Web过滤系统 [C] . 杜阿宁 ,方滨兴 . 2005第一届中国分类技术与应用研讨会（CSCA） . 2005
7. 基于SVM的中文文本分类相关算法的研究与实现 [A] . 陈平 . 2008

基于SVM的WEB中文文本分类系统研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅