基于特征分布的半监督分类

文翰; 肖南峰

首页> 中文期刊> 《北京工业大学学报》 >基于特征分布的半监督分类

基于特征分布的半监督分类

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

团队文献服务 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了避免倾向于高频词的信息增益（information gain,IG）方法忽略各类别间的相似性特点,提出了一种基于特征分布的选择方法对IG进行修正,使真正拥有高类别区分信息的特征项被保留.同时,对最大期望值（expectation maximization,EM）算法的效率低下问题加以改进,将拥有较高后验类别概率的未标注文档逐步从未标注文档集转至已标注文档集,有效减少算法迭代次数.测试结果表明,基于特征分布的半监督学习方法在Reuter-21578和Epinion.com两个不同特点的数据集上都取得了较好的分类效果和性能.%It is crucial for semi-supervised learning（SSL） to cut down the dimension of the feature space through feature selection.The popular information gain（IG） selection method,which inclines to high frequency words,always ignores similarity of classes.Thus,the classification performance of characteristics IG is unstable.This paper puts forward a feature distribution selection to help IG retain features possessing high categories discriminative information.To solve the inherent efficiency problem of the expectation maximization（EM） algorithm,unlabeled documents that possess maximum posterior category probability are transferred from unlabeled collection to labeled collection.The iteration number of the improved EM is obviously reduced.Finally,experimental evaluation on Reuter-21578 and Epinion.com with two different data sets shows that the semi-supervised learning method using feature distribution obtains very effective performance for micro average F1 criterion.

著录项

来源
《北京工业大学学报》 |2012年第1期|75-80|共6页
作者
文翰; 肖南峰;
展开▼
作者单位

华南理工大学计算机科学与工程学院,广州510006／佛山科学技术学院理学院,广东佛山528000;

华南理工大学计算机科学与工程学院,广州510006;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习 ;
关键词
半监督分类 ; 特征分布 ; 类相似性;

相似文献

中文文献
外文文献
专利

1. 基于图像与电流特征的电熔镁炉欠烧工况半监督分类方法 [J] . 卢绍文 ,温乙鑫 . 自动化学报 . 2021 ,第004期
2. 基于光滑表示的半监督分类算法 [J] . 王省 ,康昭 . 计算机科学 . 2021 ,第003期
3. 基于权值多样性的半监督分类算法 [J] . 毛铭泽 ,曹芮浩 ,闫春钢 . 计算机应用 . 2021 ,第009期
4. 基于拉德马赫方法的Dropout算法在半监督分类应用 [J] . 司梦月 ,董文玉 . 信息与电脑 . 2021 ,第017期
5. 基于最大投票融合的高光谱影像半监督分类 [J] . 刘丽丽 ,周绍光 ,丁倩 . 地理空间信息 . 2020 ,第005期
6. 基于C均值聚类和图转导的半监督分类算法 [C] . WANG Na ,王娜 ,WANG Xiaofeng . 第十七届中国Rough集与软计算学术会议、第十一届中国Web智能学术研讨会、第十一届中国粒计算研讨会及第五届三支决策学术会议联合会议（CRSSC-CWI-CGrC-3WD 2017） . 2017
7. 基于卷积神经网络的高光谱图像半监督分类方法研究 [A] . 张凯琳 . 2020

基于特征分布的半监督分类

摘要

著录项

相似文献

相关主题

期刊订阅