首页> 中国专利> 一种用于中文历史文献密集文本的文字检测识别方法

一种用于中文历史文献密集文本的文字检测识别方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种用于中文历史文献密集文本的文字检测识别方法，包括步骤：(1)数据获取：采集历史文献图像，进行人工标注；(2)数据预处理：对历史文献图像进行竖直投影做列切分，将历史文献中竖直的文本按列切开；(3)构建并预训练一个单行文本识别的卷积神经网络；(4)构建一个对单行文本进行文字检测的卷积神经网络，与进行单行文本识别的卷积神经网络共享浅层参数，同时进行训练；文字检测卷积神经网络利用文本识别卷积神经网络所提供的文本信息，对检测的位置进行微调，实现精确检测历史文献中密集文本的单个文字位置。本发明采用了卷积神经网络实现文本识别，并且充分利用文本识别分类器的指导信息，检测的效果可以更加精确。

著录项

公开/公告号CN109800756A

专利类型发明专利
公开/公告日2019-05-24

原文格式PDF
申请/专利权人华南理工大学;华南理工大学珠海现代产业创新研究院;
展开▼

申请/专利号CN201811533332.0
发明设计人黄伟国;金连文;杨海林;
展开▼

申请日2018-12-14
分类号G06K9/32(20060101);G06K9/34(20060101);G06K9/62(20060101);
代理机构44245 广州市华学知识产权代理有限公司;
代理人李斌
地址 510640 广东省广州市天河区五山路381号
入库时间 2024-02-19 09:57:37

法律信息

法律状态公告日

法律状态信息

法律状态
2019-06-18

实质审查的生效 IPC(主分类):G06K9/32 申请日:20181214

实质审查的生效
2019-05-24

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种用于中文历史文献密集文本的文字检测识别方法 [P] . 中国专利： CN109800756B . 2021.02.12
2. 一种用于中文历史文献密集文本的文字检测识别方法 [P] . 中国专利： CN109800756A . 2019-05-24
3. CHINESE CHARACTER ESTIMATION PROGRAM, DEVICE, SERVER, AND METHOD FOR ESTIMATING CHINESE CHARACTER SYMBOLIZING OBJECT TEXT [P] . 日本专利： JP2014186429A . 2014-10-02

机译：中文字符估计程序，设备，服务器和方法，用于估计中文字符符号化对象文本
4. Self-adhesive sheet for folding label - is of transparent material with two text panels alongside each other and covering panels on opposite sides AB DE4211373C The sheet(1) has two parts(2a,2b) joined together, and each divided by a transverse fold line(3) into a text(4a,4b) and covering(5a,5b) panel. It is of transparent material, and the parts are offset sideways from each other. The text panels are alongside each other, while one covering panel is above its text panel and the other below it. There can be a fixing lug between the text panels, and from which portions in line with each other protrude from opposite sides. Each panel can have a perforation near the edge, these being one above the other in the folded position. ADVANTAGE - The text is resistant to liquids e.g. as used for cleaning. AN 93328649 TI Video image flicker reduction system for video camera - uses detected phase shift amplitude to control variable amplifier for video output signal [P] . 德国专利： DE4211427A1 . 1993-10-14

机译：用于折叠标签的不干胶纸-是透明材料，具有两个彼此相邻的文本面板，并且在相对的侧面覆盖面板AB DE4211373C纸（1）具有两个部分（2a，2b）连接在一起，每个部分都被横向折叠分开将第（3）行插入到text（4a，4b）和cover（5a，5b）面板中。它是透明材料，各部分相互错开。文本面板彼此并排，而一个覆盖面板在其文本面板上方，另一覆盖面板在其下方。文本面板之间可以有一个固定凸耳，彼此对齐的部分从固定凸耳从相对的侧面伸出。每个面板的边缘附近可以有一个穿孔，在折叠位置上每个穿孔都在另一个穿孔之上。优点-文字可以抵抗液体，例如用于清洁。 AN 93328649 TI用于摄像机的视频图像闪烁减少系统-使用检测到的相移幅度来控制视频输出信号的可变放大器
5. method for automatic detection of in order to kreuzrasterung in text or strichvorlagen inserted halbtonbildern during the abtastvorganges in after the faksimileverfahren working equipmentin particular, devices for the transmission of printed matter, e.g. zeitungsseiten [P] . 瑞士专利： CH415739A . 1966-06-30

机译：一种自动检测方法，以在文本复印机或复印机工作后的装模期间自动检测插入的文字或strichvorlagen halbtonbildern，特别是用于传输印刷品的设备，例如时代报