首页> 中国专利> 基于语言模型的业务数据筛选方法和装置、介质、设备

基于语言模型的业务数据筛选方法和装置、介质、设备

摘要

本公开实施例公开了一种基于语言模型的业务数据筛选方法和装置,该方法包括:将属于通用领域的待筛选数据输入至通用领域对应的第一语言模型中,得到待筛选数据中至少一个词的第一组出现概率值;将属于通用领域的待筛选数据输入至预定业务领域对应的第二语言模型中,得到待筛选数据中至少一个词的第二组出现概率值;根据第一组出现概率值,确定待筛选数据的第一评分值;根据第二组出现概率值,确定待筛选数据的第二评分值;根据第一评分值和第二评分值,确定待筛选数据是否为属于所述预定业务领域的业务数据。本公开实施例有利于降低业务数据的筛选成本,并有利于提高业务数据的筛选效率,进而有利于提高对应预定业务领域的语言模型的训练效率。

著录项

  • 公开/公告号CN111767712A

    专利类型发明专利

  • 公开/公告日2020-10-13

    原文格式PDF

  • 申请/专利号CN201910262775.9

  • 发明设计人 李亚滨;潘复平;

    申请日2019-04-02

  • 分类号G06F40/216(20200101);G06F40/289(20200101);

  • 代理机构11657 北京思源智汇知识产权代理有限公司;

  • 代理人毛丽琴

  • 地址 100080 北京市海淀区中关村大街1号3层318

  • 入库时间 2023-06-19 08:31:50

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号