首页> 中国专利> 一种优化训练样本集的KNN文本分类方法

一种优化训练样本集的KNN文本分类方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种优化训练样本集的KNN文本分类方法，属于文本挖掘，自然语言处理等领域，解决传统KNN文本分类方法的效率和准确率低的问题。本发明在于对训练用文本数据和待分类文本数据进行文本预处理；将预处理后的训练用文本数据和待分类文本数据分别进行文本表示；对文本表示的训练用文本数据和待分类文本数据分别利用遗传算法进行特征提取；对提取的训练用文本数据特征进行分类训练，使用经过优化样本集的KNN算法进行训练分类，构造文本分类器；将文本分类器作用于特征提取后的待分类文本数据，得到待分类文本数据的分类结果。本发明能够更好的应用于文本信息挖掘系统。

著录项

公开/公告号CN104063472B

专利类型发明专利
公开/公告日2017-02-15

原文格式PDF
申请/专利权人电子科技大学;
展开▼

申请/专利号CN201410305607.0
发明设计人屈鸿;谌语;绍领;解修蕊;黄利伟;
展开▼

申请日2014-06-30
分类号G06F17/30(20060101);G06N3/02(20060101);
代理机构51223 成都华风专利事务所(普通合伙);
代理人徐丰
地址 611731 四川省成都市高新区(西区)西源大道2006号
入库时间 2022-08-23 09:52:05

法律信息

法律状态公告日

法律状态信息

法律状态
2017-02-15

授权

授权
2014-10-22

实质审查的生效 IPC(主分类):G06F 17/30 申请日:20140630

实质审查的生效
2014-09-24

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种优化训练样本集的KNN文本分类方法 [P] . 中国专利： CN104063472B . 2017.02.15
2. 一种基于K最近邻KNN的文本分类方法及其设备 [P] . 中国专利： CN109993216B . 2021.05.11
3. Text automatic classification device, text automatic classification program, and computer-readable recording medium recording the text automatic classification method and text automatic classification program [P] . 日本专利： JP4711556B2 . 2011-06-29

机译：文本自动分类装置，文本自动分类程序以及记录该文本自动分类方法和文本自动分类程序的计算机可读记录介质
4. A method of classifying text units based on scores, computer program product and computer therefor [P] . 德国专利： DE112013002187T5 . 2015-01-08

机译：一种基于分数的文本单元分类方法，计算机程序产品及其计算机
5. TEXT CLASSIFICATION SYSTEM, TEXT CLASSIFICATION METHOD, AND TEXT CLASSIFICATION PROGRAM [P] . 世界知识产权组织专利： WO2015025978A1 . 2015-02-26

机译：文本分类系统，文本分类方法和文本分类程序