首页> 中国专利> 一种基于BERT-CNN的金融文本分类方法及系统

一种基于BERT-CNN的金融文本分类方法及系统

摘要

本发明公开了一种基于BERT‑CNN的金融文本分类方法及系统,该方法包括以下步骤:对金融文本数据进行预处理操作,预处理操作包括去除噪声信息、文本处理、分词处理、去除停用词;将所得到的输入向量输入BERT层得到的初始特征向量;将所得初始特征向量使用卷积神经网络提取高级特征向量;将所得高级特征向量和初始特征向量进行特征融合;通过线性全连接层和softmax分类层得到金融文本类别。本发明将BERT提取的初始特征与卷积神经网络层提取高级特征进行融合,通过融合特征挖掘金融文本的信息,解决了模型训练中存在着过拟合现象,有效提高模型分类准确度,同时避免BERT全部层的特征组成矩阵进行二维卷积,进而忽略不同层的特征分辨率之间存在的差异对模型性能的影响。

著录项

  • 公开/公告号CN114064888A

    专利类型发明专利

  • 公开/公告日2022-02-18

    原文格式PDF

  • 申请/专利权人 暨南大学;

    申请/专利号CN202111175876.6

  • 发明设计人 刘冠;贾燕;黄斐然;

    申请日2021-10-09

  • 分类号G06F16/35(20190101);G06F16/33(20190101);G06F40/126(20200101);G06F40/284(20200101);G06K9/62(20220101);G06N3/04(20060101);G06N3/08(20060101);G06Q40/00(20120101);

  • 代理机构44245 广州市华学知识产权代理有限公司;

  • 代理人郑秋松

  • 地址 510632 广东省广州市天河区黄埔大道西601号

  • 入库时间 2023-06-19 14:14:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-08

    实质审查的生效 IPC(主分类):G06F16/35 专利申请号:2021111758766 申请日:20211009

    实质审查的生效

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号