【24h】

WWWからの性能表抽出のためのキーワード獲得と重み付け

机译:WWWからの性能表抽出のためのキーワード獲得と重み付け

获取原文
获取原文并翻译 | 示例
       

摘要

我々は現在,Web上の製品の性能などを記述した表を用いた製品選択支援システムの構築を行っている.Web上の表はHTMLの<TABLE>タグを用いて記述されるが,<TABLE>タグは表を記述する以外にも,レイアウトを整えたりする場合にも頻繁に用いられる.ある特定の領域においては,<TABLE>の70%がレイアウト目的で使われているとの報告もある.そのため,HTML文書中の<TABLE>タグが表なのか,それとも他の目的で使用されているのかを判別する必要がある.本論文では,Webからの性能表抽出のためのキーワード生成の手法について提案する.キーワードの重み付けには,エントロピーを用いた隼法とベイズの定理を用いた手法の二つを検証した.実験により,それぞれの重み付けによる表抽出の精度について考察する.
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号