首页> 中国专利> 一种基于随机森林算法的网页排序方法

一种基于随机森林算法的网页排序方法

摘要

本发明提供一种基于随机森林算法的网页排序方法,包括:获取搜索网页对应的关键词和关键备选词;计算所述搜索网页对应的关键词或者关键备选词词频和权重;计算搜索网页质量相关指标PR值;计算搜索网页的枢纽值和权威值;计算最近浏览网页与所述搜索网页的相关性与最近浏览网页的关键词以及关键备选词的TF‑IDF值乘积;计算输出指标:规定访问时间以上的搜索网页用户网页浏览次数与满足条件的网页停留时间某一函数的乘积是否大于设定的阀值;建立随机森林模型并记录相应结果;计算最终的所述搜索网页得分并排序。与现有技术相比,本发明的利用随机森林的方法对传统的HITS算法进行一定程度上的改良,提升用户的搜索体验,使得信息来得更好更准。

著录项

  • 公开/公告号CN108182186B

    专利类型发明专利

  • 公开/公告日2020-10-02

    原文格式PDF

  • 申请/专利权人 广东精点数据科技股份有限公司;

    申请/专利号CN201611122793.X

  • 发明设计人 陶波;许飞月;陈乐焱;简宋全;

    申请日2016-12-08

  • 分类号G06F16/9532(20190101);G06F16/9535(20190101);G06F40/284(20200101);G06N20/00(20190101);

  • 代理机构11473 北京隆源天恒知识产权代理事务所(普通合伙);

  • 代理人闫冬

  • 地址 510630 广东省广州市天河北路906高科大厦A-701

  • 入库时间 2022-08-23 11:15:40

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号