首页> 中国专利> 语料泛化方法、装置、电子设备及可读存储介质

语料泛化方法、装置、电子设备及可读存储介质

摘要

本发明提供一种语料泛化方法、装置、电子设备及可读存储介质,通过接收用户输入的初始语料,将初始语料切分为语料组分;合并相同的语料组分,形成多个语料组分节点;根据每个初始语料中各语料组分的连接顺序,在多个语料组分节点中确定每个初始语料中各语料组分之间的转移路径;遍历转移路径,建立路径可达的语料组分之间的转移关系,形成泛化后的语料。从而实现了基于已有的语料组分之间转移关系泛化生成大量的衍生语料,且该泛化的语料是基于初始语料的语料组分转移顺序生成的,符合人们的自然语言表达,增加了用于模型训练的语料数量,提升了语料质量,使得采用该泛化后的语料训练出的模型的识别效果得以提升。

著录项

  • 公开/公告号CN108460017B

    专利类型发明专利

  • 公开/公告日2019-07-30

    原文格式PDF

  • 申请/专利权人 百度在线网络技术(北京)有限公司;

    申请/专利号CN201810165781.8

  • 发明设计人 王武生;石磊;

    申请日2018-02-28

  • 分类号

  • 代理机构北京同立钧成知识产权代理有限公司;

  • 代理人闵南燕

  • 地址 100085 北京市海淀区上地十街10号百度大厦三层

  • 入库时间 2022-08-23 10:37:17

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-07-30

    授权

    授权

  • 2018-09-21

    实质审查的生效 IPC(主分类):G06F 17/27 申请日:20180228

    实质审查的生效

  • 2018-09-21

    实质审查的生效 IPC(主分类):G06F 17/27 申请日:20180228

    实质审查的生效

  • 2018-08-28

    公开

    公开

  • 2018-08-28

    公开

    公开

  • 2018-08-28

    公开

    公开

查看全部

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号