首页> 中国专利> 一种服务于智能问答系统的文本匹配算法

一种服务于智能问答系统的文本匹配算法

摘要

本发明公开了一种服务于智能问答系统的文本匹配算法,包括问答库文本数据集、已优化的jieba分词器、已训练的word2vector模型和已修正的余弦相似度模型。本发明中,通过将jieba分词的精确模式和搜索模式的优点相结合得到已优化的jieba分词器,在对“咨询问题”进行中文分词以后,通过word2vector模型进行词向量嵌入,将中文分词转换为可以计算的词向量,再对其进行修正后的余弦相似度模型计算,提高了相似度计算的精度,从而实现文本相似度计算,最后对于相似度进行排序,给定相似度阈值,选择问答库文本数据集中相似度计算值最高并且超过给定相似度阈值的“固定问题”和对应的“固定答案”作为“咨询问题”的问答对。

著录项

  • 公开/公告号CN112988970A

    专利类型发明专利

  • 公开/公告日2021-06-18

    原文格式PDF

  • 申请/专利权人 浙江康旭科技有限公司;

    申请/专利号CN202110267040.2

  • 申请日2021-03-11

  • 分类号G06F16/33(20190101);G06F16/332(20190101);G06F16/335(20190101);G06F40/284(20200101);

  • 代理机构

  • 代理人

  • 地址 310000 浙江省杭州市余杭区仓前街道良睦路1399号2-206

  • 入库时间 2023-06-19 11:29:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-10-27

    发明专利申请公布后的驳回 IPC(主分类):G06F16/33 专利申请号:2021102670402 申请公布日:20210618

    发明专利申请公布后的驳回

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号