首页> 中国专利> 语义特征的生成方法、模型训练方法、装置、设备及介质

语义特征的生成方法、模型训练方法、装置、设备及介质

摘要

本公开公开了一种语义特征的生成方法、模型训练方法、装置、设备及介质,涉及机器学习与自然语言处理等人工智能技术领域。具体实现方案为:对目标文档进行片段切分,得到目标文档的片段序列;采用预先训练的双向语义编码模型,生成目标文档的片段序列中各文档片段的语义特征;基于目标文档的片段序列中各文档片段的语义特征,获取目标文档的语义特征。本公开还公开了双向语义编码模型的训练方法。本公开的技术,通过采用预先训练的双向语义编码模型,能够有效地提高目标文档中各文档片段的语义特征的准确性,进而能够有效地提高目标文档的语义特征的表达准确性。而且本公开还能够有效地提高双向语义编码模型对语义特征表示的准确性。

著录项

  • 公开/公告号CN112560501B

    专利类型发明专利

  • 公开/公告日2022-02-25

    原文格式PDF

  • 申请/专利权人 北京百度网讯科技有限公司;

    申请/专利号CN202011562653.0

  • 发明设计人 王硕寰;丁思宇;尚骏远;孙宇;

    申请日2020-12-25

  • 分类号G06F40/30(20200101);G06K9/62(20220101);G06N20/20(20190101);

  • 代理机构11412 北京鸿德海业知识产权代理有限公司;

  • 代理人田宏宾

  • 地址 100085 北京市海淀区上地十街10号百度大厦2层

  • 入库时间 2022-08-23 13:09:47

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号