首页> 中国专利> 一种基于注意力机制的商品名称短文本分类方法和系统

一种基于注意力机制的商品名称短文本分类方法和系统

摘要

一种基于注意力机制的商品名称短文本分类方法,包含:对商品名称进行预处理,去除非中文字段以及一些特殊字符;通过jieba分词,将预处理后的商品短文本分成若干个词,去除停用词,对得到的词进行短补长切,统一词的长度到事先设定好的词个数;将每个词利用Global Entity Linking算法进行实体消歧与链接,通过链接到百度百科的外部知识库,用其结果对短文本中的词扩充解释,并将实体链接的结果利用Bert进行word embedding编码,得到相应的特征向量;将得到的向量喂入Transformer网络,利用self‑attention机制,挖掘不同词对于税码分类的共享程度,赋予不同词的不同权重,最后通过Softmax对其进行分类,将概率最高的税码类别作为商品名称所属类别。本发明还包括实施上述发明方法的系统。

著录项

  • 公开/公告号CN113157918B

    专利类型发明专利

  • 公开/公告日2022-07-22

    原文格式PDF

  • 申请/专利权人 浙江工业大学;

    申请/专利号CN202110307421.9

  • 申请日2021-03-23

  • 分类号G06F16/35;G06F40/289;G06F40/30;G06N20/00;

  • 代理机构杭州天正专利事务所有限公司;

  • 代理人王兵

  • 地址 310014 浙江省杭州市下城区潮王路18号

  • 入库时间 2022-09-06 00:36:08

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-22

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号