首页> 中国专利> 一种基于蚁群算法的网页类特征向量提取方法

一种基于蚁群算法的网页类特征向量提取方法

摘要

本发明涉及一种利用改进的蚁群算法提取特征词,具体过程:在预处理时,将所有信息存取到hash表中,其中coco_prepare存取每篇文章的信息,包括文章的id和每个词及其出现的次数;readhdfs_prepare存取每个类的训练集的统计信息,包括每个词的词频,文档数,和类名共现的次数;设置蚁群算法的参数:蚂蚁个数M;迭代次数N;蚂蚁走的步数即特征词个数K;初始化路径信息素矩阵adMatrixs;局部更新衰减速率p1和全局更新衰减速率p2;蚂蚁释放信息素量m;本发明首次引入蚁群算法解决在没有准确样本集的情况下为类提取准确的特征向量的问题。

著录项

  • 公开/公告号CN103744959B

    专利类型发明专利

  • 公开/公告日2017-01-25

    原文格式PDF

  • 申请/专利权人 同济大学;

    申请/专利号CN201410004815.7

  • 申请日2014-01-06

  • 分类号

  • 代理机构上海天协和诚知识产权代理事务所;

  • 代理人叶凤

  • 地址 200092 上海市杨浦区四平路1239号

  • 入库时间 2022-08-23 09:51:15

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-01-25

    授权

    授权

  • 2014-05-21

    实质审查的生效 IPC(主分类):G06F 17/30 申请日:20140106

    实质审查的生效

  • 2014-04-23

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号