基于位置的文本分类样本剪裁及加权方法

刘海峰; 刘守生; 苏展

首页> 中文期刊>计算机工程与应用 >基于位置的文本分类样本剪裁及加权方法

基于位置的文本分类样本剪裁及加权方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

k近邻方法是文本分类中广泛应用的方法，对其性能的优化具有现实需求。使用一种改进的聚类算法进行样本剪裁以提高训练样本的类别表示能力；根据样本的空间位置先后实现了基于类内和类间分布的样本加权；改善了k近邻算法中的大类别、高密度训练样本占优现象。实验结果表明，提出的改进文本加权方法提高了分类器的分类效率。%K nearest neighbor method is widely used in text classification method. There is the real need of improving the algorithm performance. It uses an improved clustering algorithm for sample cut to improve training sample category repre-sentation capability. According to the spatial location of the sample, it realizes the sample weighting based on class inner and class between. It improves the phenomenon that categories, high density of training samples have the advantage in k nearest neighbor algorithm. The experimental result shows that the improved text weighted method improves the classifi-cation efficiency.

著录项

来源
《计算机工程与应用》|2015年第2期|131-135|共5页
作者
刘海峰; 刘守生; 苏展;
展开▼
作者单位

解放军理工大学理学院;

南京 210007;

解放军理工大学理学院;

南京 210007;

解放军理工大学理学院;

南京 210007;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
样本剪裁; 样本加权; 文本聚类; k近邻; 文本分类;
入库时间 2023-07-24 17:05:46

相似文献

中文文献
外文文献
专利

1. 文本分类中基于K-means的类偏斜KNN样本剪裁 [J] . 刘海峰 ,姚泽清 ,苏展 . 微电子学与计算机 . 2012,第5期
2. 基于样本密度加权的神经网络分类器在文本分类中的应用 [J] . 廖一星 . 计算机应用与软件 . 2009,第009期
3. 一种基于样本加权的位置文本排序算法 [J] . 敖飞 ,陈梅 . 贵州大学学报（自然科学版） . 2010,第005期
4. 基于异构图卷积网络的小样本短文本分类方法 [J] . 袁自勇 ,高曙 ,曹姣 . 计算机工程 . 2021,第012期
5. 基于优化样本分布抽样集成学习的半监督文本分类方法研究 [J] . 徐禹洪 ,黄沛杰 . 中文信息学报 . 2017,第006期
6. 基于优化样本分布抽样集成学习的半监督文本分类方法研究 [C] . 徐禹洪 ,黄沛杰 . 第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会 . 2017
7. 基于位置加权和特征贡献度的中文文本分类研究 [A] . 张燕 . 2015

基于位置的文本分类样本剪裁及加权方法

摘要

著录项

相似文献

相关主题

期刊订阅