首页> 外文期刊>電子情報通信学会技術研究報告 >Webページからの地域情報取得手法
【24h】

Webページからの地域情報取得手法

机译:从网页获取区域信息的方法

获取原文
获取原文并翻译 | 示例
       

摘要

In recent years, the local government is offering regional information through the Web. However, the website is not made in consideration of machine processing. Some the methods of extracting information intended for the HTML document are developed for this problem. However, in the case of the regional information web pages, some problems are left in the existing method. The first is "Only same template web site". The second is "Only information of one every one page". Because there is such a problem the existing method are not applicable in the regional information web page. In this paper, we propose a method of information extraction of the regional information by the attribute word. This method grasps the meaning of the word by attribute word including the meaning of the word. And, regional information is extracted from the resemblance of case information and HTML document. In addition, the information extraction expands the object range to a hyperlink document.%ウェブやセンサなどの現実社会から情報を取り込み,人へのサービスを提供する地域サービス基盤を構築するためには,地方自治体のウェブサイトから地域情報を取り込む必要がある.しかし,現状のウェブサイトは,人が読むことを前提としており,視覚的に読みやすいデザインやウェブページの構成がされているため.機械処理によって情報を取得することが考慮されておらず困難である.この課題に対して,HTML文書を対象とした情報取得手法が,いくつかの技術が開発されている.しかし,テンプレートやページ中の情報量に制約があり,地域の情報に適用した場合に正しく取得できない問題があった.そこで本稿では,イベント開催情報と道路工事情報を地域情報とした地域情報の取得を行う手法を提案する.この手法では,語の意味を包含する表現となる属性語が,情報となる語の直前に記述される可能性があることに着目し,語の意味を把握することや,情報取得を行う範囲を単一ウェブページに限定せず,ハイパーリンク先の情報も取得することにより,複数のウェブページに渡り情報が記述されることがある地域情報ウェブページの情報取得に適用し,評価実験を行い動作の確認をした.
机译:近年来,当地政府正在通过Web提供区域信息。但是,该网站并未考虑机器处理。针对此问题开发了一些提取用于HTML文档的信息的方法。然而,在区域信息网页的情况下,现有方法仍然存在一些问题。第一个是“仅相同的模板网站”。第二个是“仅每一页一页的信息”。由于存在这样的问题,因此现有方法不适用于区域信息网页。本文提出了一种利用属性词对区域信息进行信息抽取的方法。该方法通过包括单词含义的属性单词来掌握单词的含义。并且,从案例信息和HTML文档的相似性中提取区域信息。另外,信息提取还将对象范围扩展到超链接文档。によって地域情报を取り込む必要がある。しかし,现状のウェブサイトは,人が読むことを放置としており,视覚的に読みやすいデザインやウェブページの构成がされているため。机械处理によって情报を取得することが考虑されておらず困难である。このスに対して,HTML文书を対象とした情报取得手法が,いくつかの技术が开発されている。そこで,地域の情报に适用した场合した正しく取得できない问题があった。の意味を包含する表现となる属性语が,情报となる语の直前に记述される可以されるとに着目し,语の意味を把握することや,情报取得を行う范囲を単一ウェブページに限定せず,ハイパーリンク先の情报も取得することにより,复数のウェブページに渡り情报が记述されることがある地域情报ウェブページの情报取得に适用し,评価実験を行い动作の确认をした。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号