【24h】

WebページのHTML構文構造を考慮した地域イベント情報の抽出

机译:考虑网页的HTML语法结构的区域事件信息的提取

获取原文
获取原文并翻译 | 示例
           

摘要

近年,人々が関心を持つイベント抽出に関する取組みがなされている.本研究では,新聞,テレビなどの情報源で予告されないような地域イベントの情報の集約を目的とする.本稿では,イベント会場候補のWebページから地域イベントの日時,場所などの情報を抽出する手法について提案する.情報の抽出方法として,(1)HTMLの構文構造を利用したルールベースモデルによる抽出,(2)Support Vector Machineによる抽出,という2つの手法を試み,抽出精度の比較結果について述べる.
机译:近年来,人们努力提取人们感兴趣的事件。这项研究的目的是收集有关本地事件的信息,而这些事件是报纸和电视台等信息来源所未曾预言的。在本文中,我们提出了一种从候选事件场所的网页中提取信息的方法,例如区域事件的日期,时间和地点。作为信息提取方法,我们尝试了两种方法:(1)使用HTML的语法结构通过基于规则的模型进行提取,以及(2)通过Support Vector Machine进行提取,并描述了提取精度的比较结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号