首页> 中国专利> 一种基于模型融合的海量旅游网络文本语义分析方法

一种基于模型融合的海量旅游网络文本语义分析方法

摘要

本发明公开了一种基于模型融合的海量旅游网络文本语义分析方法,获取评论数据集,并对数据集中的数据进行预处理;对数据集中的数据进行可视化分析;对评论数据集采用DBSCAN密度聚类,获得数据集D1;利用Word2Vec模型,得到数据集D2;利用Simhash算法,得到数据集D3;利用N‑Gram语言模型得到数据集D4;将数据集D1‑D4中的数据结果综合得到数据集D5;将预处理之后的数据集D5导入TF‑IDF模型和LDA模型,提取得到关键词和主题词;词向量化计算每条评论的关键词向量与主题词向量之间的距离,并根据距离输出结果高的词;根据特色词、酒店名称、酒店类型相互组合构建三元组,得到知识图谱。

著录项

  • 公开/公告号CN115099241A

    专利类型发明专利

  • 公开/公告日2022-09-23

    原文格式PDF

  • 申请/专利权人 郑州信大先进技术研究院;

    申请/专利号CN202210772206.0

  • 申请日2022-06-30

  • 分类号G06F40/30;G06F40/289;G06F40/216;

  • 代理机构郑州德勤知识产权代理有限公司;

  • 代理人黄红梅

  • 地址 450000 河南省郑州市高新技术产业开发区莲花街55号

  • 入库时间 2023-06-19 16:56:28

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-23

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号