法律状态公告日
法律状态信息
法律状态
2014-01-08
授权
授权
2012-07-18
实质审查的生效 IPC(主分类):B02C18/00 申请日:20111013
实质审查的生效
2012-06-20
公开
公开
技术领域
本发明属于图像处理以及信息复原技术领域,具体涉及一种碎纸机纸质 条状碎片恢复系统,本发明还涉及利用该恢复系统进行纸质条状碎片恢复的 方法。
背景技术
碎纸机在销毁办公文件的方式,为满足大多数政府机构、企业、等的保 密需要而被广泛应用。然而,在某些情况下,如错将重要的公司文件当做废 弃文件处理成碎片的废纸;被犯罪嫌疑人利用碎纸机销毁的与犯罪相关的各 种文本文件,又需要将已经被破碎的文本信息重新恢复。
事实上,由于碎纸机的碎纸效果一般是以毫米(mm)为单位的,破碎 后所得到的往往是碎状、条状、段状等效果。因此面对大量的、细小的、破 碎的纸片,人们根本就无从下手,因此,提供一种使得已被破碎的纸张恢复, 得到其文本信息的技术十分必要。
发明内容
本发明的目的是提供一种碎纸机纸质条状碎片恢复系统,以解决已被破 碎的文件的恢复问题。
本发明的另一目的是提供利用上述恢复系统进行纸质条状纸片恢复的 方法,同样达到解决已被破碎的文件的恢复的问题。
为达上述目的,本发明所采用的技术方案,一种碎纸机纸质条状碎片恢 复系统,该系统由用于将条状碎纸整理成标准化的条状纸带的采集模板、用 于将采集模板上的条状纸带转换为数字图像并保存原始的图像文件的扫描 仪和对所述的图像文件进行处理使已被破碎的文本信息恢复原样的计算机 构成。
本发明特点还在于,
其中采集模板是长方形,其上沿径向均匀设置有用于镶嵌条状碎纸的矩 形槽。
其中采集模板的宽和高分别是200mm和5mm,其长是300mm、100mm 或50mm。
其中矩形槽的长和高分别是200mm和0.5mm,其宽是2.2mm、3.2mm 或4.2mm。
其中矩形槽是采用红色或绿色的PMMA有机玻璃制成,且其角度误差 小于0.001度。
其中扫描仪是CanonScan 3200型扫描仪。
本发明所采用的另一技术方案是,一种进行纸质条状碎片恢复的方法, 该方法包括以下步骤:
1)碎片整理,根据条状碎纸的长度和宽度对其进行分类,选择与其尺 寸适配的采集模板和矩形槽,将其展平固定在适配的矩形槽中,得到固定有 条状碎纸的采集模板;
2)信息扫描,使用扫描仪扫描固定有条状碎纸的采集模板,并将扫描 所得数字图像以BMP格式进行保存;
3)信息恢复,通过计算机上安装的碎纸拼接软件,对上步所得的数字 图像进行处理,使得已经被破坏的文本信息得以恢复,最后以BMP格式进 行保存;
所述采集模板是长方形的,其上均匀设置有用于镶嵌条状碎纸的矩形 槽。
本发明特点还在于,
步骤2)中扫描固定有条状碎纸的采集模板时,该采集模板的直角边与 扫描仪面板的直角边要完全契合,防止出现倾斜,且一次性可以扫描多个该 采集模板。
对扫描所得的数字图像的处理过程是:
a、二值化处理
对扫描所得的数字图像进行二值化处理,通过选取合适的阈值,将条状 碎纸和采集模板有效地区分出来,即:设原始图像为f(x,y),二值化后的图 像为g(x,y),则:
其中,Th为图像的阈值;
b、去噪处理
二值化后的图像为g(x,y),噪声信号为n(x,y),去噪后的图像为e(x,y), 则:
e(x,y)=g(x,y)-n(x,y);
c、碎片有效区域分割处理
由于扫描得的数字图像中包含有若干条随机排放顺序的条状碎纸,必须 先将其独立分割出来,通过图像投影的方法,设统计图像每一列白点数Li, 其中i=1,...n;
通过确定的条状碎纸起始位置,沿着各个条状碎纸的边沿将其从整幅图 像中分割出来,并将其归一化,设置成标准化的条状纸带;
d、信息增强处理
采用图像增强的方法,即对图像进行腐蚀和膨胀运算,增强条状纸带中 文字的信息量,具体是设二值化图像为F,其连通域为x,结构元素为S, 当一个结构元素S的原点移动到图像坐标(x,y)处时,记为Sxy,则:
腐蚀运算:
膨胀运算:
e、条状碎纸拼接处理
采用相似度匹配的方法,对凌乱次序的条状碎纸进行拼接,即根据每张 条状碎纸图像的左、右边列处的信息,计算它与其他条状碎纸图像的左、右 边列的相关性,根据最大相关性的原则,将各个条状碎纸拼接在一起,最终 得到的图像就是要恢复的原始文本信息,具体是设每张纸带图中右列信息为 Pici_R,右列信息的均值为左列信息为Pici_L,左列信息的均值为 C为图像的相关系数,则:
最终得到完整的恢复后的原始文本信息。
本发明的有益效果是:
1、能够有效恢复我国保密等级为一般销毁处理级别和部分秘密级别的 文本信息,并能有效恢复德国保密等级为第一级、第二级和部分第三级级别 的文本信息;
2、本发明提供的一种碎纸机纸质条状碎片恢复系统及其方法,能够有 效处理办公场所常用的A4、16K、B5等纸张类型被破碎后的重新恢复、获 取文本信息;
3、通过简单的操作流程使得信息恢复变得很容易。
附图说明
图1是本发明碎纸机纸质条状碎片恢复系统的硬件连接结构示意图;
图2是本发明恢复系统中采集模板的结构示意图;
图3是本发明恢复发方法中对扫描所得的数字图像进行处理的流程示意 图。
图中,1、采集模板;2、扫描仪;3、计算机;4、矩形槽。
具体实施方式
下面结合附图及实施例对本发明作进一步说明:
为了将已被破碎的碎纸机纸质碎片重新恢复,以得到原始的文本信息, 本发明采用的技术方案是:碎纸机纸质条状碎片恢复系统包括碎纸信息采集 和碎纸信息处理两个部分,采集部分由采集模板1和扫描仪2构成,将纸质 的条状破碎信息转换成数字图像;处理部分将采集到的数字图像通过相应的 处理算法在计算机3上进行自动恢复,将已经破碎的文本信息重新恢复出来。 其中,采集模板1按照尺寸要求,将若干条已经破碎的条状碎片固定到相应 位置上,通过该模板可以将散乱的、扭曲的碎片设置成标准化的条状纸带, 以便进行扫描和后续处理。扫描仪2使用普通家用型的扫描仪,将模板以及 上面的条状破碎信息转换成分辨率很大的数字图像,并保存成原始的图像文 件。在计算机3上,通过编写好的处理算法对扫描获得的数字图像进行处理, 将若干已经破碎的文本信息重新组合在一起,恢复其原本的模样,并将其以 文件的形式保存在计算机3上。
我国的碎纸机行业的安全保密等级标准:OAS20368。按照其保密等级分 为:绝密(碎纸效果:1.9×1.9mm-0.8×12mm,纸屑面积:≤10m m2,碎纸形 状:沫状)、机密(碎纸效果:1.9×15mm-2×16mm,纸屑面积:≤32m m2, 碎纸形状:粒状)、秘密(碎纸效果:3×30mm-4×30-80mm,纸屑面积:≤320m m2,碎纸形状:段状),一般销毁处理(碎纸效果:1.9mm-4mm,纸屑面积: ≤1740m m2,碎纸形状:条状)。同期,进口碎纸机按照德国保密等级标准: DIN32757,一级保密(条状:6.3-12mm),二级保密(条状:3.9-5.8mm/粒 状6-10.5×40-80mm),三级保密(条状:1.9mm/粒状3.9-6×25-53mm),四 级保密(粒状:1.9-2×15mm),五级保密(粒状:0.78×11mm),六级保密(粒 状:1×5mm)。
基于以上因素,本实施例提供的碎纸机纸质条状碎片恢复系统,如图1 所示,由用于将条状碎纸转化成标准化的条状纸带的采集模板1、用于将采 集模板1上的条状纸带转换为数字图像并保存原始的图像文件的扫描仪2和 对所得的图像文件进行处理使已被破碎的文本信息恢复原样的计算机3构 成。
为了避免在整理过程中,零散、扭曲的纸质碎片在扫描时产生倾斜畸变, 并提高扫描的效率,使用采集模板1可以同时固定20~30张碎片,本实施 例所提供的采集模板1的材质选用普通的PMMA有机玻璃,颜色为红色或 绿色,形状为长方形板型材,角度误差小于0.001度,如图2所示,在采集 模板1上等间隔地挖出一系列相同尺寸的矩形槽4,使条状碎纸能够刚好内 嵌在这些矩形槽4中,采集模板1分为三种规格,第一种是:长300mm、 宽200mm、高5mm的长方形模板,第二种是:长100mm、宽200mm、高 5mm的长方形模板,第三种是:长50mm、宽200mm、高5mm的长方形模 板。
同时,考虑到所处理的条状碎片(条状碎纸)大小有所不同,以及条状 碎片(条状碎纸)存在毛刺边缘等问题,经过反复测试,确定矩形槽4的尺 寸也分为三种规格,即第一种是:宽度2.2mm、高度0.5m;第二种是:宽 度3.2mm、高度0.5m;第三种是:宽度4.2mm、高度0.5m,这三种矩形槽 4的长度与采集模板1的宽度相同,即都是200mm。
该碎纸机纸质条状碎片恢复系统中使用的扫描仪2,本实施例选用的是 日本佳能公司的CanonScan 3200型扫描仪,其基本参数包括,扫描元件: CCD,最大幅面:A4,光学分辨率(dpi):1200×2400,色彩深度(位):48, 接口:USB 2.0,类型:家用型,扫描速度:15秒(600dpi),扫描介质:图片, 文字,照片,光源:冷阴极管,支持操作系统:Windows 2000专业版/Windows XP家庭版/专业版/Windows Vista家庭版/专业版,电源电压:220~240V, 电源频率:50/60Hz,工作温度:5~35℃,工作湿度20%-80%,存储温度: -20~60℃存储湿度10~90%。
而计算机3则选取通用型个人PC机即可。
利用上述恢复系统进行纸质条状纸片恢复的方法,主要是依靠安装在计 算机3中的碎片恢复软件读取扫描图像,并对图像进行分割,将各个条状碎 片(条状碎纸)转换成标准化的纸带,按照其相关性进行拼接,最终复原成 原始的文本信息,并将结果以图片的格式存储在计算机3上。
其具体实施步骤是:
步骤一,碎片整理,即按照碎片的尺寸对其进行分类,根据条状碎纸的 长度选择第一类(长度300mm),第二类(长度100mm),或第三类(长度 50mm)的采集模板1,再根据条状碎片(条状碎纸)的实际宽度,选择不 同的矩形槽4的尺寸,即:第一类(宽度2.2mm),第二类(宽度3.2mm), 或第三类(宽度4.2mm),将条状碎片(条状碎纸)固定到相应的矩形槽4 内,固定时需要展平每张碎片,尽量避免出现褶皱、缺损等问题。一个采集 模板1一次可以固定20~30张碎片,扫描完毕后,该采集模板1可以重复 使用。通过采集模板1使用可以将大量散乱的、扭曲的碎片设置成标准化的 条状纸带以便进行信息识别。
步骤二,信息扫描,即使用扫描仪2得到数字图像,扫描仪2的分辨率 设置为最大值,在放置模板时,要将模板的直角边与扫描仪2面板的直角边 之间完全契合,以避免出现可能的倾斜问题。扫描仪2可以一次处理多个模 板,进而提高工作效率。将扫描仪2输出的数字图像以BMP格式保存。
步骤三,信息恢复,即在计算机3上,通过编写碎片恢复软件对扫描获 的数字图像进行处理,对文本信息重新恢复,并将恢复的结果保存为BMP 格式文件放在计算机3上。
其中,碎纸拼接软件对扫描所得的数字图像的处理过程如图3所示,
1、二值化处理(图像二值化)
由于碎片的边缘上存在许多不规则的毛刺,这些干扰对信息辨识和恢复 影响很大,首先对图像进行二值化处理,通过选取合适的阈值,将碎片和模 板有效地区分出来,即:设原始图像为f(x,y),二值化后的图像为g(x,y)。
其中,Th为图像的阈值。
2、去噪处理(图像去噪)
由于二值化后的图像存在较多的噪声点,这些噪点对于之后的碎片识别 会有很糟的影响,所以,需要对整幅图像进行去噪处理,将分布散乱的白色 噪点去除掉。即:设二值化后的图像为g(x,y),噪声信号为n(x,y),去噪后的 图像为e(x,y),则:
e(x,y)=g(x,y)-n(x,y)。
3、碎片有效区域分割处理(图像分割)
由于扫描得的数字图像中包含有若干条随机排放顺序的碎片,必须先将 其独立分割出来。通过图像投影的方法,设统计图像每一列白点数Li,其中 i=1,...n。
通过确定的碎片起始位置,沿着各个碎片的边沿将其从整幅图像中分割 出来,并将其归一化,设置成标准化的条状纸带。
4、信息增强处理(图像增强)
由于图像扫描、去噪等处理使得分割之后的文字信息存在一定的缺损, 因此,采用图像增强的方法,即对图像进行腐蚀和膨胀运算,增强纸带中文 字的信息量。设二值化图像为F,其连通域为x,结构元素为S,当一个结 构元素S的原点移动到图像坐标(x,y)处时,记为Sxy。
其中:
腐蚀运算用表示,其定义为:
该公式说明,S对F进行腐蚀是所有S中包含于F的点Sxy的集合的平移;
膨胀运算用表示,其定义为:
该公式说明,S对F进行膨胀是所有位移点Sxy的集合。
5、碎片拼接处理(图像匹配)
采用相似度匹配的方法,对凌乱次序的碎片进行拼接。即:根据每张纸 带图像左、右边列处的信息,计算它与其他纸带图像左、右边列的相关性, 根据最大相关性的原则,将各个纸带拼接在一起,最终得到的图像就是要恢 复的原始文本信息。设每张纸带图中右列信息为Pici_R,右列信息的均值为 左列信息为Pici_L,左列信息的均值为C为图像的相关系数。
通过以上步骤和处理过程,实现对已被碎纸机破碎的条状碎片(条状碎 纸)的整理、识别,最后使其文本信息得以恢复。
透过上述碎纸机纸质条状碎片恢复系统及利用该恢复系统进行纸质条 状纸片恢复的方法,能够有效恢复我国保密等级为一般销毁处理级别和部分 秘密级别的文本信息,并能有效恢复德国保密等级为第一级、第二级和部分 第三级级别的文本信息。而且能够有效处理办公场所常用的A4、16K、B5 等纸张类型被破碎后的重新恢复、获取文本信息。通过简单的操作流程使得 信息恢复变得很容易。
机译: 碎片恢复控制设备,碎片恢复卫星,捕获接口设备,连接设备,碎片恢复系统,碎片恢复方法和碎片恢复程序
机译: 一种将连续供应的条状形式的片或条状片切成碎片或颗粒的方法。 (通过Google翻译进行机器翻译,没有法律约束力)
机译: 连续条状材料的印刷单元,特别是纸质文件