毛筆文字で書かれた文書などはOCR の適用が困難である.こういった文書に対する解析手法として,文書を画像として扱い,テンプレートマッチングの要領で特定の単語を検索するという方法(ワードスポッティング)が提案されている.本研究はこの手法の高速化法を提案する.ある照合範囲におけるクエリーとの距離から,始点を固定して照合範囲を拡大した場合のクエリーとの距離の最小値を計算する.最小値が探索に用いる閾値より小さければ,クエリーとの照合を行う必要が無くなるため,照合回数を削減することができる.実際の手書き文書の画像を用いて実験を行った結果,計算時間を80%から50%程度まで削減することができた.%It is still difficult to apply the optical character recognition system to characterize hand-written documents such as those written by writing brushes. As a retrieving method to those documents, a method treating documents as the series of images and searching in them like template matching is proposed. This paper proposes a faster method. The proposed method estimates the lowest-distance between a query and a given image area. If an estimated lowest-distance is smaller than a threshold, we need not to verify with query. In experiments performed by using historical handwritten Japanese documents, the computational time of the proposed method reduces up to 50-80% of the previous.
展开▼