首页> 中国专利> UGC文本内容的挖掘方法、系统、设备和存储介质

UGC文本内容的挖掘方法、系统、设备和存储介质

摘要

本发明提供一种UGC文本内容的挖掘方法、系统、设备和存储介质,挖掘方法包括:获取UGC文本内容;获取用户输入的主题词;基于主题词得到主题词的扩展词集合,其中,扩展词集合包括与主题词近似的扩展词,扩展词由基于UGC文本内容训练得到的模型输出;输出扩展词集合;将扩展词集合中被选择的扩展词作为主题词选择结果;计算主题词选择结果与UGC文本内容的相关度,按照相关度降序排序,输出扩展词的相关度排序靠前的若干UGC文本内容。本发明帮助用户精准地挖掘主题词相关的扩展词,从而能够通过选中的扩展词得到用户感兴趣的UGC文本内容,提高了精准度,提高了挖掘效率,节省了用户的时间。

著录项

  • 公开/公告号CN113434767A

    专利类型发明专利

  • 公开/公告日2021-09-24

    原文格式PDF

  • 申请/专利权人 携程旅游信息技术(上海)有限公司;

    申请/专利号CN202110767197.1

  • 发明设计人 刘新;何蜀波;孙玉霞;朱登龙;

    申请日2021-07-07

  • 分类号G06F16/9535(20190101);G06F40/295(20200101);

  • 代理机构31283 上海弼兴律师事务所;

  • 代理人杨东明;罗朗

  • 地址 201203 上海市浦东新区张江高科技园区碧波路518号302室

  • 入库时间 2023-06-19 12:42:10

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号