基于CRF的原生数字图像文本提取研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

网页与电子邮件中的图像经常嵌入一些文字信息。以图像作为文字的载体源于许多需求，例如美化页面标题和文章标题，广告中吸引人们的注意，还有一些隐藏信息如垃圾邮件中的不良文本信息可以很容易地转为原生数字图像在网络中传播，从而避过文本过滤技术等。原生数字图像是用计算机软件生成的图像，图像中的文字包含许多有用的信息，能够客观反映图像所要表达的内容。因此，原生数字图像的文本提取对于网页内容的索引和检索、获取和过滤（如广告和垃圾邮件的过滤）等都存在着重要的意义。但是，原生数字图像文本提取工作面临分辨率低、文字本身大小和字体颜色的多样性以及边缘柔化所引起的连通体生成困难等问题，而真实场景图像的文本提取方法不一定适用于原生数字图像中的文本提取，所以原生数字图像中的文本提取成为了一个具有重要意义和挑战性的课题。
　　本文主要研究了基于条件随机场的原生数字图像中的文本提取。条件随机场不仅具有对上下文信息进行建模的能力，而且能够基于有监督学习自动确定模型中的参数。本文利用条件随机场根据连通体自身特征和连通体之间的上下文特征做出文本连通体与非文本连通体的分类，能够有效地从原生数字图像中提取文本信息。实验表明其有效性。

著录项

作者
焦姣;
展开▼
作者单位

南开大学;

展开▼
授予单位南开大学;
学科计算机应用技术
授予学位硕士
导师姓名王庆人,王恺;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
文本提取; 条件随机场; 二值化; 连通体分析; 原生数字图像;

相似文献

中文文献
外文文献
专利

1. 基于BERT-BiLSTM-CRF的SPECT诊断文本病灶提取研究 [J] . 张淋均 . 信息与电脑 . 2021,第005期
2. 基于词向量+BiLSTM+CRF的农业技术需求文本实体提取 [J] . 宋林鹏 ,刘世洪 ,王翠 . 江苏农业科学 . 2021,第005期
3. 基于CRF模型的短文本信息流话题提取 [J] . 王宗尧 ,刘金岭 ,崔俊峰 . 淮阴工学院学报 . 2016,第005期
4. 基于混合CRFsSVM应用于文本信息分类 [J] . 胡改蝶 ,马建芬 . 石家庄铁道大学学报（自然科学版） . 2020,第004期
5. 基于混合CRFsSVM应用于文本信息分类 [J] . 胡改蝶 ,马建芬 . 石家庄铁道大学学报：自然科学版 . 2020,第004期
6. 基于文本的图片检索中图片相关文本提取技术的研究 [C] . 热依玛依·买买提 ,维尼拉·木沙江 . 第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会 . 2010
7. 基于显著视觉和文本特征提取的视觉和文本图像检索方法研究 [A] . SALAHUDDIN . 2019

基于CRF的原生数字图像文本提取研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅