首页> 中国专利> 文档与话题相关度的计算方法、装置、设备及介质

文档与话题相关度的计算方法、装置、设备及介质

摘要

本发明提供一种文档与话题相关度的计算方法,该方法获得文档集合;获得与预设话题对应的词典;其中词典是使用半监督学习算法对话题数据进行学习构建的,且词典包括与预设话题语义相关的多个词语;针对文档集合中的任一文档,根据词典中的词语在文档集合中的命中情况,计算任一文档与词典对应的预设话题的相关度。文档与预设话题的相关度可以表示出文档内容与预设话题之间的相关密切程度,可以作为考量文档是否适合改编为热点话题相关影视作品的依据。另外,本申请还提供了文档与话题相关度的相关设备,以保证上述方法在实际中的应用及实现。

著录项

  • 公开/公告号CN109871433B

    专利类型发明专利

  • 公开/公告日2021-07-23

    原文格式PDF

  • 申请/专利权人 北京奇艺世纪科技有限公司;

    申请/专利号CN201910131086.4

  • 申请日2019-02-21

  • 分类号G06F16/33(20190101);G06F16/36(20190101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人钱娜;王宝筠

  • 地址 100080 北京市海淀区北一街2号爱奇艺创新大厦10、11层

  • 入库时间 2022-08-23 12:11:06

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号