首页> 中国专利> 基于文本的行业识别模型的确定方法及装置

基于文本的行业识别模型的确定方法及装置

摘要

本发明公开了一种基于文本的行业识别模型的确定方法及装置,通过分开使用来源于同一原始文本的中文文本训练行业识别模型和使用英文文本训练行业识别模型,得到中文文本行业识别模型和英文文本行业识别模型,减少了使用中英文文本共同训练行业识别模型时由于可能存在引入中英文之间的关联而导致训练出的低准确性甚至无法训练出行业识别模型的发生情况,能够提高行业识别模型的训练准确性以及可靠性,确定出了具有适用性强的行业识别模型,以及通过将文本中每个词且与该词相邻词的语义信息加载到该词的特征向量上,有利于进一步提高行业识别模型的训练精准性、可靠性以及适用性,有利于提高识别出与文本匹配的行业类别的准确性及效率。

著录项

  • 公开/公告号CN113688247A

    专利类型发明专利

  • 公开/公告日2021-11-23

    原文格式PDF

  • 申请/专利权人 有米科技股份有限公司;

    申请/专利号CN202111150563.5

  • 发明设计人 黄于晏;陈莹莹;李展铿;

    申请日2021-09-29

  • 分类号G06F16/35(20190101);G06F40/30(20200101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构44202 广州三环专利商标代理有限公司;

  • 代理人肖宇扬;江银会

  • 地址 510006 广东省广州市番禺区小谷围街青蓝街26号1701

  • 入库时间 2023-06-19 13:21:35

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号