首页> 中国专利> 一种用于智能生成类文本的业务热词识别转换的方法

一种用于智能生成类文本的业务热词识别转换的方法

摘要

本发明公开了一种用于智能生成类文本的业务热词识别转换的方法,收集语料并构建业务热词库;将智能生成得到的文本按业务热词的长度进行划分,并分别与热词进行一次简要快速的相似度匹配计算,过滤掉绝大部分相似度较低的划分词;对保留的相似度较高的划分词,再进行一次具体的相似度匹配计算,保留相似度高的划分词;使用语料训练统计语言模型,将保留的相似度高的划分词,采用热词对其进行替换形成新的句子文本,用预训练好的语言模型对替换前与替换后两个句子进行打分;根据语言模型打分结果,判定替换是否保留。可以快速和智能地为智能生成的文本进行识别匹配,在文本中的词汇与热词相似度较高及替换后语句流畅度较高的情况下实现智能替换。

著录项

  • 公开/公告号CN111680476A

    专利类型发明专利

  • 公开/公告日2020-09-18

    原文格式PDF

  • 申请/专利号CN202010457472.5

  • 发明设计人 徐波;

    申请日2020-05-26

  • 分类号G06F40/151(20200101);G06F16/335(20190101);G06F40/216(20200101);G06F40/289(20200101);G06F40/205(20200101);

  • 代理机构11411 北京联瑞联丰知识产权代理事务所(普通合伙);

  • 代理人赵娜

  • 地址 510530 广东省广州市萝岗区伴河路90号自编一栋301房

  • 入库时间 2023-06-19 08:19:12

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号