首页> 中文会议>第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会 >基于优化样本分布抽样集成学习的半监督文本分类方法研究

基于优化样本分布抽样集成学习的半监督文本分类方法研究

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对现有文本分类方法在即时性文本信息上的挑战,考虑到即时性文本信息具有已标注数据规模小的特点,为了提高半监督学习的分类性能,本文提出一种基于优化样本分布抽样集成学习的半监督文本分类方法.首先,通过运用一种新的样本抽样的优化策略,获取多个新的子分类器训练集,以增加训练集之间的多样性和减少噪声的扩散范围,从而提高分类器的总体泛化能力;然后,采用基于置信度相乘的投票机制对预测结果进行集成,对未标注数据进行标注;最后,选取出适量的数据来更新训练模型.实验结果表明,该方法在长文本和短文本上都取得了优于研究进展方法的分类性能.

著录项

来源
《第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会》|2017年|1-12|共12页
会议地点南京
作者
徐禹洪; 黄沛杰;
展开▼
作者单位

中国中文信息学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;
关键词
文本分类; 半监督学习; 集成学习; 样本抽样策略;
入库时间 2022-08-17 11:23:55

相似文献

中文文献
外文文献
专利

1. 基于优化样本分布抽样集成学习的半监督文本分类方法研究 [J] . 徐禹洪 ,黄沛杰 . 中文信息学报 . 2017,第006期
2. 基于集成学习的半监督情感分类方法研究 [J] . 高伟 ,王中卿 ,李寿山 . 中文信息学报 . 2013,第003期
3. 基于多粒度建模的半监督文本分类方法研究 [J] . 余本功 ,汲浩敏 . 现代情报 . 2021,第006期
4. 基于特征扩展的半监督协同短文本分类方法研究 [J] . 付学敏 . 电脑知识与技术：学术版 . 2018,第10Z期
5. 基于概率超图半监督学习的专利文本分类方法研究 [J] . 刘桂锋 ,汪满容 ,刘海军 . 情报杂志 . 2016,第009期
6. 基于集成学习的半监督情感分类方法研究 [C] . 高伟 ,王中卿 ,李寿山 . 第六届全国青年计算语言学会议 . 2012
7. 基于半监督与集成学习的文本分类方法研究 [A] . 唐焕玲 . 2009

基于优化样本分布抽样集成学习的半监督文本分类方法研究

摘要

著录项

相似文献

相关主题

期刊订阅