首页> 中文期刊> 《计算机应用与软件》 >基于词向量特征扩展的中文短文本分类研究

基于词向量特征扩展的中文短文本分类研究

         

摘要

针对中文短文本词汇较少、噪声多、特征稀疏的特性,为了提高短文本分类精确度,提出一种基于维基百科词向量的特征扩展算法.利用维基百科语料集训练词向量,通过对文本关键词高相似度词集进行特征扩展,并将得到的文本用传统的分类器进行分类.实验结果表明,所提方法在短文本分类精确度上要优于其他的文本特征扩展算法.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号