In recent years, the local government is offering regional information through the Web. However, the website is not made in consideration of machine processing. Some the methods of extracting information intended for the HTML document are developed for this problem. However, in the case of the regional information web pages, some problems are left in the existing method. The first is "Only same template web site". The second is "Only information of one every one page". Because there is such a problem the existing method are not applicable in the regional information web page. In this paper, we propose a method of information extraction of the regional information by the attribute word. This method grasps the meaning of the word by attribute word including the meaning of the word. And, regional information is extracted from the resemblance of case information and HTML document. In addition, the information extraction expands the object range to a hyperlink document.%ウェブやセンサなどの現実社会から情報を取り込み,人へのサービスを提供する地域サービス基盤を構築するためには,地方自治体のウェブサイトから地域情報を取り込む必要がある.しかし,現状のウェブサイトは,人が読むことを前提としており,視覚的に読みやすいデザインやウェブページの構成がされているため.機械処理によって情報を取得することが考慮されておらず困難である.この課題に対して,HTML文書を対象とした情報取得手法が,いくつかの技術が開発されている.しかし,テンプレートやページ中の情報量に制約があり,地域の情報に適用した場合に正しく取得できない問題があった.そこで本稿では,イベント開催情報と道路工事情報を地域情報とした地域情報の取得を行う手法を提案する.この手法では,語の意味を包含する表現となる属性語が,情報となる語の直前に記述される可能性があることに着目し,語の意味を把握することや,情報取得を行う範囲を単一ウェブページに限定せず,ハイパーリンク先の情報も取得することにより,複数のウェブページに渡り情報が記述されることがある地域情報ウェブページの情報取得に適用し,評価実験を行い動作の確認をした.
展开▼