首页> 中国专利> 更新语料库的方法和装置

更新语料库的方法和装置

摘要

本发明公开了更新语料库的方法和装置,涉及计算机计算技术领域。该方法的一具体实施方式包括:对历史日志进行过滤压缩处理,生成历史日志对应的新增语料;利用线上语料库对应的埋点数据和线上语料库对应的词语得分表,确定线上语料库中的淘汰语料;将新增语料补充至线上语料库中,将淘汰语料从线上语料库中删除,以更新线上语料库。该实施方式能够保障线上语料库中的语料数量维持在一定范围内,降低运营成本,减少工作量,还可以保证线上语料库中的语料具有通用性,且可以不断跟随线上客服系统咨询的热点。

著录项

  • 公开/公告号CN113761170A

    专利类型发明专利

  • 公开/公告日2021-12-07

    原文格式PDF

  • 申请/专利号CN202010969717.2

  • 发明设计人 肖翔;何刚;何峰;

    申请日2020-09-15

  • 分类号G06F16/335(20190101);G06F16/33(20190101);G06F16/35(20190101);G06F16/36(20190101);G06F40/279(20200101);

  • 代理机构11219 中原信达知识产权代理有限责任公司;

  • 代理人王安娜;王志远

  • 地址 100176 北京市北京经济技术开发区科创十一街18号院2号楼4层A402室

  • 入库时间 2023-06-19 13:37:05

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号