首页> 外国专利> WEB SEARCH SYSTEM AND WEB SEARCH METHOD

WEB SEARCH SYSTEM AND WEB SEARCH METHOD

机译:网页搜索系统及网页搜索方法

摘要

PROBLEM TO BE SOLVED: To easily search a Web page on the Internet with high accuracy.;SOLUTION: A Web search system (100) includes: Web crawl means (12) for collecting Web pages on the Internet; an information filter (12) for extracting a Web page having high similarity by calculating similarity between each Web page collected by the Web crawl means and a sample document on a first vector space created on the basis of the sample document; clustering means (32) for performing clustering the Web page extracted by the information filter on a second vector space created on the basis of the Web page extracted by the information filter; cluster identification means (16) which creates a multi-class classifier by using a clustering result as a teacher signal, and identifies to which cluster in the second vector space an unknown Web page newly collected by the Web crawl means belongs by using the multi-class classifier.;COPYRIGHT: (C)2013,JPO&INPIT
机译:解决的问题:为了容易地以高精度在Internet上搜索网页;解决方案:Web搜索系统(100)包括:Web爬网工具(12),用于在Internet上收集网页;信息过滤器(12),用于通过在基于样本文档创建的第一矢量空间上计算由网络爬行装置收集的每个网页与样本文档之间的相似度来提取具有高度相似性的网页;聚类装置(32),用于将基于信息过滤器提取的网页在基于基于信息过滤器提取的网页而创建的第二矢量空间上进行聚类;群集识别装置(16),该装置通过使用群集结果作为教师信号来创建多类别分类器,并通过使用多目标网页识别装置新收集的未知网页来识别第二向量空间中的哪个群集类分类器。; COPYRIGHT:(C)2013,JPO&INPIT

著录项

  • 公开/公告号JP2013182466A

    专利类型

  • 公开/公告日2013-09-12

    原文格式PDF

  • 申请/专利权人 KURIMOTO LTD;

    申请/专利号JP20120046547

  • 发明设计人 OMATA NAOYASU;SEKINE SOICHI;

    申请日2012-03-02

  • 分类号G06F17/30;G06Q30/08;

  • 国家 JP

  • 入库时间 2022-08-21 17:03:14

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号