首页> 中国专利> 一种基于噪声标签学习的纳税人行业分类方法

一种基于噪声标签学习的纳税人行业分类方法

摘要

一种基于噪声标签学习的纳税人行业分类方法,首先,提取纳税人行业信息中待挖掘的文本信息进行文本嵌入,并对嵌入后的信息做特征处理;其次,提取纳税人行业信息中的非文本信息进行编码处理;再次,构建符合纳税人行业分类问题的BERT‑CNN深层网络结构,依据处理后的特征信息和目标类别数来确定网络的层数、每层的神经元个数以及输入输出的维度;然后,依次通过对比学习、最近邻的语义聚类及自标签学习对构建的网络进行预训练;最后,在所构建的深层网络基础上增加一个噪声建模层,通过网络的自信任以及噪声标签信息对噪声分布进行建模,并基于噪声标签数据进行模型训练;最终,将噪声建模层前的深层网络作为分类模型,基于此模型进行纳税人行业分类。

著录项

  • 公开/公告号CN112765358A

    专利类型发明专利

  • 公开/公告日2021-05-07

    原文格式PDF

  • 申请/专利权人 西安交通大学;

    申请/专利号CN202110201214.5

  • 发明设计人 郑庆华;赵锐;阮建飞;董博;师斌;

    申请日2021-02-23

  • 分类号G06F16/35(20190101);G06F40/117(20200101);G06F40/289(20200101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);G06Q40/00(20120101);

  • 代理机构61200 西安通大专利代理有限责任公司;

  • 代理人闵岳峰

  • 地址 710049 陕西省西安市咸宁西路28号

  • 入库时间 2023-06-19 10:54:12

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-04-07

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号