確率的トピックモデルによる文書画像の領域分割

山口　拓真; 丸山　稔

首页> 外文期刊>電子情報通信学会論文誌 >確率的トピックモデルによる文書画像の領域分割

【24h】

確率的トピックモデルによる文書画像の領域分割

机译：基于概率主题模型的文档图像分割

获取原文

获取原文并翻译 | 示例

获取外文期刊封面目录资料

开具论文收录证明 >>

文献代查 >>

文献数据库（团队版） >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

本論文では，確率的トピックモデルを用いた文書画像の領域分割について述べる．確率的トピッrnクモデルとして，bag-of-visual words表現によって画像分類などに応用されている，文書解析手法のpLSArn(probabilistic Latent Semantic Analysis)モデルを用いる．本論文では，文字領域と図表等の領域とを分離すrnることのみを目的とするのではなく，文字領域であっても言語の違いなどによって領域分割を行うことを目的とrnしている．画像を単純に分割し，それぞれの部分領域のカテゴリーを推定するといった手段を用いた場合，詳細rnな領域分割を行うためには，できるだけ部分領域を小さくすることが望ましいが，細かく分割することにより，rn各部分領域に含まれる情報量が少なくなり，誤識別を招く可能性が高くなる．そこで本論文では，最初から細かrnく分割するのではなく，十分な情報量をもつ大きさに分割し，それらにモデルを適用して得られたパラメータをrn用いて，各部分領域を再分割する手法を提案する．提案手法の検証実験の結果，高い識別率で詳細な領域分割がrn可能であることが示された．

机译：在本文中，我们使用概率主题模型描述文档图像的分割。作为概率地形模型，我们使用文档分析方法的pLSArn（概率潜在语义分析）模型，该模型用于通过视觉袋词表示进行图像分类。本文的目的不仅是将字符区域与图形和表格等区域分开，而且还要根据语言差异在字符区域中进行划分。。当使用诸如简单地划分图像并估计每个局部区域的类别的方法时，期望的是使局部区域尽可能小以便执行详细的区域划分。，Rn每个部分区域中包含的信息量很小，并且错误识别的可能性增加。因此，在本文中，不是将其从一开始就划分为较小的rns，而是将其划分为具有足够信息的大小，并将通过对模型应用模型而获得的参数用于细分每个子区域。我们提出一种方法来做到这一点。作为所提出方法的验证实验的结果，表明可以以高识别率进行详细的区域分割。

著录项

来源
《電子情報通信学会論文誌》 |2009年第6期|876-887|共12页
作者
山口　拓真; 丸山　稔;
展开▼
作者单位

信州大学工学部情報工学科;

長野市;

信州大学工学部情報工学科;

長野市;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
確率的トピックモデル; pLSA; bag-of-visual words; 文書画像; 領域分割;

机译：随机主题模型;pLSA;视觉袋;文档图像;区域分割;

相似文献

外文文献
中文文献
专利

1. 確率的トピックモデルによる文書画像の領域分割 [J] . 山口拓真, 丸山稔, Takuma YAMAGUCHI, 電子情報通信学会論文誌, D. 情報·システム . 2009,第6期

机译：通过概率主题模型对文档图像进行区域划分
2. 確率的トピックモデルによる文書画像の領域分割 [J] . 山口拓真, 丸山稔, Takuma YAMAGUCHI, 電子情報通信学会論文誌, D. 情報·システム . 2009,第6期

机译：区域分割文档图像由概率主题模型
3. NTTら業界団体を設立光通信技術を研究日本電信電話(株)(NTT、東京都千代田区)、米インテル、ソ二ー(株)(東京都港区)の3社は、新たな業界団体を設立する。光電融合技術を活用したフォトニクス関連技術の研究開発などを推進し、超大容量通信に対応できる光ネットヮーク技術の確立などを目指してハる。3-3プロセッシング領域狙う国内DRAM大手のェルピーダメモリを買収し、大きく飛躍を遂げた米マイクロンテクノロジー。2017年にはサンディスク共同創業者の1人である、Sanjay Mehrotra (サンジエイ·メイロトラ)氏を招聘。経営体制も刷新され、大きく生まれ変わった「新生マイクロン」を全面に押し出した。米サンフランシスコで開催されたプライベートイベント「MlicronInsight 2019」(現地10月24日開催)では、同社のあるべき将来像に対するメッセージが随所に散りばめられていた。 [J] . 半導体産業新聞 . 2019,第2372期

机译：成立了NTT和其他工业集团研究光通信技术的日本电报电话公司（NTT，东京千代田区），英特尔，索尼公司（东京都港区）是三个新的工业集团。建立。促进利用光电子融合技术的光子相关技术的研究和开发，并致力于建立可支持超高容量通信的光网络技术。 3-3处理领域美国Micron Technology在收购了国内主要DRAM公司Elpida Memory之后取得了巨大飞跃。 2017年，我们邀请了Sanjay联合创始人Sanjay Mehrotra。管理系统也进行了改进，我们推出了完全脱胎换骨的“新Micron”。在旧金山举行的私人活动“ Mlicron Insight 2019”（10月24日举行）上，有关公司未来愿景的信息四处散布。
4. 深層学習モデルによる音響ベクトル系列から文書ベクトル系列へのメディア横断マッピング [C] . 五藤智晃, 西村良太, 北研二情報処理学会;情報処理学会全国大会 . 2020

机译：深度学习模型从声学矢量序列到文档矢量序列的跨媒体映射
5. スパイキングニューラルネットワークによる連想記憶モジュールとデジタルコンピュータ間のインターフェース利用統計は来月からご利用いただけます [D] . 豊島尚樹 2019

机译：下个月将提供使用尖峰神经网络的关联存储模块和数字计算机之间的接口使用情况统计信息。
6. リポポリサッカライドおよびD-ガラクトサミン投与ラット急性肝不全モデルにおいて、肝微小循環障害、肝実質の低酸素およびNOX4発現の亢進は領域によるアポトーシスの相違を引き起こす [O] . 田中, 正剛, Tanaka, Masatake 2013

机译：脂多糖和D-半乳糖胺治疗的急性肝衰竭大鼠模型中，肝微循环受损，肝实质缺氧和NOX4表达增强导致局部细胞凋亡

確率的トピックモデルによる文書画像の領域分割

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅