首页> 中国专利> 基于多元表征和度量学习的试题检索方法、装置及介质

基于多元表征和度量学习的试题检索方法、装置及介质

摘要

本发明公开了一种基于多元表征和度量学习的试题检索方法、装置、计算机设备及存储介质,该方法步骤如下:获取试题库数据,提取试题中的多元异构数据的特征;对多元特征分别建立索引;提取输入查询的试题特征,利用BM25算法从题库中粗召回一定量的候选相似试题;将输入查询的试题和BM25算法返回的候选试题特征输入到多种度量学习方法进行精排,最后按照相似度程度从大到小排序返回检索结果。本发明根据试题多源异构,分别对图片、文本、公式进行特征提取和建模。采用粗召回和精排两阶段检索策略,利用概率模型召回候选试题再重排序,提升匹配的效率。在精排阶段,多维度融合不同度量学习匹配算法,提升搜索方法的准确率和鲁棒性。

著录项

  • 公开/公告号CN114048354B

    专利类型发明专利

  • 公开/公告日2022-04-26

    原文格式PDF

  • 申请/专利权人 广州启辰电子科技有限公司;

    申请/专利号CN202210018994.4

  • 发明设计人 郑彦魁;马震远;

    申请日2022-01-10

  • 分类号G06F16/901;G06F16/903;G06F16/9038;G06N3/04;G06N3/08;

  • 代理机构广州市华学知识产权代理有限公司;

  • 代理人黄卫萍

  • 地址 510799 广东省广州市黄埔区天丰路3号301-1房

  • 入库时间 2022-08-23 13:32:03

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-02-15

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号