首页> 外文期刊>電子情報通信学会技術研究報告. 人工知能と知識処理. Artificial Intelligence and Knowledge Based Processing >専門検索エンジンの半自動生成を目的とした類似度に基づくWEB学習データの精製
【24h】

専門検索エンジンの半自動生成を目的とした類似度に基づくWEB学習データの精製

机译:基于相似度的WEB学习数据的净化,以半自动生成专门的搜索引擎

获取原文
获取原文并翻译 | 示例
           

摘要

専門検索エンジンを構築する手法として小久保らが提案した“検索隠し味”は,高い適合率と再現率を示す優れた手法である.しかし検索隠し味を抽出するために,2000件のWebページを収集し,人手により正例と負例に分類しなければならず,非常に手間と時間を要する.この問題を解決するために我々は,人手で抽出した極少数のページと収集したページとの類似度を測定し,学習データを生成することで,半自動的に検索隠し味を構築する手法を提案する.評価実験により本手法が手動生成法に近い精度をもつことを実証する.
机译:作为构建专门的搜索引擎的方法,由小久保等人提出的“搜索隐藏的味道”是一种具有很高的准确性和查全率的极好的方法。但是,为了提取搜索的隐藏味道,必须收集2000个网页并将其手动分类为肯定和否定情况,这需要大量的时间和精力。为了解决这个问题,我们提出了一种方法,该方法可以通过测量极少数手动提取的页面与收集的页面之间的相似度并生成训练数据来半自动构造搜索隐藏味。去做。评估实验表明,该方法的准确性接近于手动生成方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号