基于宽度和词向量特征的文本分类模型

李雪松

首页> 中文期刊> 《计算机系统应用》 >基于宽度和词向量特征的文本分类模型

基于宽度和词向量特征的文本分类模型

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

针对词向量文本分类模型记忆能力弱,缺少全局词特征信息等问题,提出基于宽度和词向量特征的文本分类模型(WideText):首先对文本进行清洗、分词、词元编码和定义词典等,计算全局词元的词频-逆文档频度(TF-IDF)指标并将每条文本向量化,将输入文本中的词通过编码映射到词嵌入矩阵中,词向量特征经嵌入和平均叠加后,和基于TF-IDF的文本向量特征进行拼接,传入到输出层后计算属于每个分类的概率.该模型在低维词向量的基础上结合了文本向量特征的表达能力,具有良好的泛化和记忆能力.实验结果表明,在引入宽度特征后,WideText分类性能不仅较词向量文本分类模型有明显提升,且略优于前馈神经网络分类器.

著录项

来源
《计算机系统应用》 |2021年第3期|177-183|共7页
作者
李雪松;
展开▼
作者单位

中国银行总行个人数字金融部北京 100818;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
Word2Vec; FastText; WideText; 文本分类;

相似文献

中文文献
外文文献
专利

1. 基于词向量特征的文本分类模型研究 [J] . 张敬谊 ,张亚红 ,李静 . 信息技术与标准化 . 2017,第005期
2. 基于词向量特征扩展的中文短文本分类研究 [J] . 雷朔 ,刘旭敏 ,徐维祥 . 计算机应用与软件 . 2018,第008期
3. 基于词向量空间模型的中文文本分类方法 [J] . 胡学钢 ,董学春 ,谢飞 . 合肥工业大学学报（自然科学版） . 2007,第010期
4. 基于词向量特征的藏语谓语动词短语识别模型 [J] . 李琳1 ,赵维纳1 ,泽旺宽卓1 . 电子技术与软件工程 . 2019,第004期
5. 基于词向量特征的循环神经网络语言模型∗ [J] . 张剑 ,屈丹 ,李真 . 模式识别与人工智能 . 2015,第004期
6. 基于词向量空间模型的文本分类方法 [C] . 董学春 ,胡学钢 ,谢飞 . 全国第17届计算机科学与技术应用（CACIS）学术会议 . 2006
7. 融合主题模型与词向量的短文本分类方法研究 [A] . 邵云飞 . 2019

基于宽度和词向量特征的文本分类模型

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅