首页> 中国专利> 问句语义解析规则模板的生成方法、装置、设备及存储介质

问句语义解析规则模板的生成方法、装置、设备及存储介质

摘要

本发明提供了问句语义解析规则模板的生成方法、装置、设备及存储介质,方法包括:采集线上问句,对每个所述问句进行分词、词性及词语拼音识别;统计各词语的词频,基于所述词频及词性,确定重要词语列表,确定所述重要词语列表中各词语出当前问句中的百分比位置信息及方差;遍历每个线上问句,基于所述重要词语列表生成泛化规则模版;基于泛化能力对所述泛化规则模版进行筛选得到第一过滤规则模版;基于匹配准确率对所述第一过滤规则模版进行筛选得到问句语义解析规则模板。本发明从线上问句库中,自动挖掘产生高质量规则匹配模板,并通过自动策略产生一个泛化力、解析准确率都较高的规则模板,从而从根源上解决了现有的线上问句解析问题。

著录项

  • 公开/公告号CN111858900B

    专利类型发明专利

  • 公开/公告日2020-12-25

    原文格式PDF

  • 申请/专利权人 杭州摸象大数据科技有限公司;

    申请/专利号CN202010992511.1

  • 申请日2020-09-21

  • 分类号G06F16/332(20190101);G06F16/33(20190101);G06F16/35(20190101);G06F40/30(20200101);

  • 代理机构33356 杭州知学知识产权代理事务所(普通合伙);

  • 代理人张雯

  • 地址 311300 浙江省杭州市余杭区余杭街道文一西路1818-2号中国人工智能小镇6-6楼

  • 入库时间 2022-08-23 11:26:46

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号