首页> 中国专利> 一种基于知识图谱的古代诗词语义检索方法

一种基于知识图谱的古代诗词语义检索方法

摘要

发明公开了一种基于知识图谱的古代诗词语义检索方法,包括:首先对爬取数据进行SPACY处理,获得符合规范数据集,再使用BERT分类算法比较相似问题的相似度及实体识别THULAC对数据集进行古诗词系统的问句相似度比较和全句中关键字的提取,通过逆向最大匹配算法切分用户输入语料,与系统自定义字典匹配,构造Cypher查询语句,将查询实体数据返还WEB应用程序,从Neo4j库中查询到与关键字有关的实体。用户输入问题是根据白话文翻译古诗词的问题,先使用Seq2Seq对用户输入的白话文内容进行古诗词的翻译,再使用聚类算法Doc2vec和距离度量算法计算古诗词内容实体间相似度,返回出内容相似度最佳的前10个选项。通过ECharts渲染古诗词实体属性数据和实体间关系数据,实现古诗词实体可视化。

著录项

  • 公开/公告号CN112101040A

    专利类型发明专利

  • 公开/公告日2020-12-18

    原文格式PDF

  • 申请/专利权人 淮阴工学院;

    申请/专利号CN202010842031.7

  • 申请日2020-08-20

  • 分类号G06F40/30(20200101);G06F40/58(20200101);G06F40/295(20200101);G06F40/242(20200101);G06F40/216(20200101);G06F40/211(20200101);G06F16/35(20190101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构32204 南京苏高专利商标事务所(普通合伙);

  • 代理人梁耀文

  • 地址 223005 江苏省淮安市经济技术开发区枚乘东路1号

  • 入库时间 2023-06-19 09:13:40

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号