首页> 外文期刊>電子情報通信学会論文誌 >確率的トピックモデルによる文書画像の領域分割
【24h】

確率的トピックモデルによる文書画像の領域分割

机译:基于概率主题模型的文档图像分割

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

本論文では,確率的トピックモデルを用いた文書画像の領域分割について述べる.確率的トピッrnクモデルとして,bag-of-visual words表現によって画像分類などに応用されている,文書解析手法のpLSArn(probabilistic Latent Semantic Analysis)モデルを用いる.本論文では,文字領域と図表等の領域とを分離すrnることのみを目的とするのではなく,文字領域であっても言語の違いなどによって領域分割を行うことを目的とrnしている.画像を単純に分割し,それぞれの部分領域のカテゴリーを推定するといった手段を用いた場合,詳細rnな領域分割を行うためには,できるだけ部分領域を小さくすることが望ましいが,細かく分割することにより,rn各部分領域に含まれる情報量が少なくなり,誤識別を招く可能性が高くなる.そこで本論文では,最初から細かrnく分割するのではなく,十分な情報量をもつ大きさに分割し,それらにモデルを適用して得られたパラメータをrn用いて,各部分領域を再分割する手法を提案する.提案手法の検証実験の結果,高い識別率で詳細な領域分割がrn可能であることが示された.
机译:在本文中,我们使用概率主题模型描述文档图像的分割。作为概率地形模型,我们使用文档分析方法的pLSArn(概率潜在语义分析)模型,该模型用于通过视觉袋词表示进行图像分类。本文的目的不仅是将字符区域与图形和表格等区域分开,而且还要根据语言差异在字符区域中进行划分。 。当使用诸如简单地划分图像并估计每个局部区域的类别的方法时,期望的是使局部区域尽可能小以便执行详细的区域划分。 ,Rn每个部分区域中包含的信息量很小,并且错误识别的可能性增加。因此,在本文中,不是将其从一开始就划分为较小的rns,而是将其划分为具有足够信息的大小,并将通过对模型应用模型而获得的参数用于细分每个子区域。我们提出一种方法来做到这一点。作为所提出方法的验证实验的结果,表明可以以高识别率进行详细的区域分割。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号