首页> 外文期刊>電子情報通信学会技術研究報告. 人工知能と知識処理. Artificial Intelligence and Knowledge Based Processing >専門検索エンジンの半自動生成を目的とした類似度に基づくWEB学習データの精製
【24h】

専門検索エンジンの半自動生成を目的とした類似度に基づくWEB学習データの精製

机译:基于对专业搜索引擎的半自动生成相似性的Web学习数据净化

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

専門検索エンジンを構築する手法として小久保らが提案した“検索隠し味”は,高い適合率と再現率を示す優れた手法である.しかし検索隠し味を抽出するために,2000件のWebページを収集し,人手により正例と負例に分類しなければならず,非常に手間と時間を要する.この問題を解決するために我々は,人手で抽出した極少数のページと収集したページとの類似度を測定し,学習データを生成することで,半自動的に検索隠し味を構築する手法を提案する.評価実験により本手法が手動生成法に近い精度をもつことを実証する.
机译:作为构建专业搜索引擎的方法,Kogubo提出的“搜索隐藏品味”是一种出于高符合性和再现率的优异方法。 但是,为了提取搜索隐藏的味道,必须收集2000个网页并分类为聚合和负片情况,这需要非常时间和精力。 为了解决这个问题,我们通过测量提取和收集的极数页面之间的相似性并产生学习数据来提出半自动搜索隐藏的味道。 评估实验表明,该方法具有接近手动生成方法的精度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号