首页> 中国专利> 一种预算执行审计中多标记不平衡文本分类方法

一种预算执行审计中多标记不平衡文本分类方法

摘要

本发明公开一种预算执行审计中多标记不平衡文本分类方法,包括:构建预算执行及审计领域关键词库,从中选择种子词作为标签描述,然后基于分词工具和关键词库进行分词,并计算标签和分词对应的嵌入矩阵;构建神经网络计算词以及短语和标签(即标签描述)的相似度矩阵,基于构建的池化层求取词权重,结合词嵌入矩阵求取句子嵌入矩阵,输出给分类器获取预测结果;引入非平衡数据权重到损失函数中,并将标签描述加入损失函数中,以强化对小类别和标签的学习,以最小化损失函数为目标训练获得模型,可对未知标签的支付摘要文本数据进行有效分类。本发明有效解决了预算执行审计中针对支付凭证摘要文本的多标记不平衡分类问题。

著录项

  • 公开/公告号CN114722189A

    专利类型发明专利

  • 公开/公告日2022-07-08

    原文格式PDF

  • 申请/专利号CN202111534284.9

  • 发明设计人 伍之昂;张璐;方昌健;

    申请日2021-12-15

  • 分类号G06F16/35;G06F16/38;

  • 代理机构南京天华专利代理有限责任公司;

  • 代理人刘畅;徐冬涛

  • 地址 210000 江苏省南京市浦口区江浦街道雨山西路86号

  • 入库时间 2023-06-19 15:55:34

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号