首页> 中国专利> 基于大数据的儿童读物类书籍装帧设计方法及装置

基于大数据的儿童读物类书籍装帧设计方法及装置

摘要

本申请实施例公开了一种基于大数据的儿童读物类书籍装帧设计方法、装置、设备及存储介质,属于大数据处理技术领域,该方法包括:获取目标书籍的第一信息,进行第一统计,获取第一指数;构建便于目标书籍进行装帧筛选的装帧模板训练集;获取训练集中不同装帧模板的文字样式、插图、色彩、纸质材料和版面信息,构成格式信息;对不同装帧模板的所述格式信息分别进行统计,分别选择被装帧模板使用概率最多的格式信息,作为优选模板的格式信息,生成优选模板;将优选模板作为目标书籍的装帧模板,进行线上模拟装帧。本申请有助于用户快速进行儿童读物类书籍装帧模板筛选,节省了人力物力和时间消耗,一定程度上简化了儿童读物类书籍装帧设计流程。

著录项

  • 公开/公告号CN112307530A

    专利类型发明专利

  • 公开/公告日2021-02-02

    原文格式PDF

  • 申请/专利权人 郑州轻工业大学;

    申请/专利号CN202011001747.0

  • 发明设计人 乔杨;梁哲;崔潇月;

    申请日2020-09-22

  • 分类号G06F30/10(20200101);G06F30/27(20200101);G06F40/186(20200101);G06T11/60(20060101);G06F16/951(20190101);G06F111/20(20200101);

  • 代理机构41177 河南豫龙律师事务所;

  • 代理人高继秀

  • 地址 450000 河南省郑州市金水区东风路5号郑州轻工业大学

  • 入库时间 2023-06-19 09:46:20

说明书

技术领域

本申请涉及大数据处理技术领域,尤其涉及一种基于大数据的儿童读物类书籍装帧设计方法、装置、设备及存储介质。

背景技术

书籍装帧设计是指从书籍文稿到成书出版的整个设计过程,也是完成从书籍形式的平面化到立体化的过程,它包含了艺术思维、构思创意和技术手法的系统设计。书籍的开本、装帧形式、封面、腰封、字体、版面、色彩、插图、以及纸张材料、印刷、装订及工艺等各个环节的艺术设计。

目前在进行书籍装帧设计时,主要先由书籍作者提供纸质稿件,再由装帧设计者设计出装帧模板,最后由出版社提供印刷件,协同完成整个书籍的装帧设计,但是这种方式需要多个环节共同完成,既耗费人力物力资源,也耗费时间;而且,尤其是对于儿童书籍这种包含多个插画,多种色彩的书籍装帧,在进行装帧模板设计时,过程要远远比普通书籍繁琐。由此可知,现有技术进行儿童书籍装帧设计时,具有耗费大量人力物力、装帧时间及流程繁琐的问题。

发明内容

本申请实施例的目的在于提出一种基于大数据的儿童读物类书籍装帧设计方法、装置、设备及存储介质,以解决现有技术中进行儿童书籍装帧设计时耗费大量人力物力、装帧时间及流程繁琐的问题。

为了解决上述技术问题,本申请实施例提供一种基于大数据的儿童读物类书籍装帧设计方法,采用了如下所述的技术方案:

一种基于大数据的儿童读物类书籍装帧设计方法,包括:

获取目标书籍的第一信息,进行第一统计,获取第一指数;

通过大数据的方式,获取海量装帧模板,构建第一装帧模板库;

通过大数据的方式,分别获取所述第一装帧模板库中不同装帧模板被装帧用户采纳的次数;

基于所述采纳次数和正态分布算法,获取满足预设概率阈值的采纳次数对应的不同装帧模板,构成第二装帧模块库;

通过大数据的方式,分别获取所述第二装帧模块库中不同装帧模板被装帧用户进行采纳时,使用所述装帧模板进行装帧的书籍的第一信息;

分别获取所述装帧模板进行装帧的书籍的第一指数,作为参照指数,使用数组的方式分别生成参照指数集;

分别获取所述第一指数在不同参照指数集中对应的占比率,若所述占比率满足预设阈值,获取与其对应的参照指数集,获取所述参照指数集中的装帧模板,构成第三装帧模板库;

获取所述第三装帧模板库中不同装帧模板的文字样式,插图,色彩,纸质材料和版面信息,构成格式信息;

对所述不同装帧模板的所述格式信息分别进行统计,分别选择被装帧模板使用概率最多的格式信息,作为优选模板的格式信息,生成优选模板;

将所述优选模板作为目标书籍的装帧模板,进行线上模拟装帧。

进一步的,所述基于大数据的儿童读物类书籍装帧设计方法,所述第一信息包括:

所述目标书籍中的文字数量、章节数量、各章节文字数量、不同章节的段落数量、不同段落中的文字数量、句子数量、各句子中的文字数量、问句数量;

所述目标书籍的作者或者主编姓名、书籍名称、出版社名称。

进一步的,所述基于大数据的儿童读物类书籍装帧设计方法,所述进行第一统计,获取第一指数包括:

分别对所述目标书籍中的文字数量、章节数量、各章节文字数量、不同章节的段落数量、不同段落中的文字数量、句子数量、各句子中的文字数量、问句数量进行统计,生成第一有序数组;

获取所述目标书籍对应的作者或者主编姓名、书籍名称、出版社名称,对所述第一有序数组进行扩容,生成第二有序数组;

将上述第二有序数组作为第一指数。

进一步的,所述基于大数据的儿童读物类书籍装帧设计方法,所述通过大数据的方式包括:

使用HTTrack抓取工具,以“书籍装帧模板”为抓取关键词组,获取包含不同书籍装帧模板的网址,通过所述网址在互联网上进行抓取,获取海量装帧模板,构建第一装帧模板库;

使用ParseHub抓取工具,将所述第一装帧模板库中的不同装帧模板对应的网址作为目标网址,对目标网址中对应的内容进行页面解析,分别获取所述第一装帧模板库中不同装帧模板被装帧用户采纳的次数;

基于所述第二装帧模块库中不同装帧模板被装帧用户进行采纳的日志信息,分别获取所述第二装帧模块库中不同装帧模板被装帧用户进行采纳时,使用所述装帧模板进行装帧的书籍的第一信息。

进一步的,所述基于大数据的儿童读物类书籍装帧设计方法,所述基于所述采纳次数和正态分布算法,获取满足预设概率阈值的采纳次数对应的不同装帧模板,构成第二装帧模块库包括:

基于JFreeChart绘图工具,对所述第一装帧模板库中不同装帧模板被装帧用户采纳的次数,构建条形分布图;

对所述条形分布图中条形图进行谷-峰-谷调整,构成符合正态分布的条形分布图,并获取其对应的正态分布曲线;

获取在[-1σ,1σ]范围内,所述正态分布曲线对应的满足预设概率阈值的条形分布图;

通过所述满足预设概率阈值的条形分布图分别获取其对应的装帧模板,以所述装帧模板作为元素,构建第二装帧模块库。

进一步的,所述基于大数据的儿童读物类书籍装帧设计方法,所述分别获取所述第一指数在不同参照指数集中对应的占比率,若所述占比率满足预设阈值,获取与其对应的参照指数集,获取所述参照指数集中的装帧模板,构成第三装帧模板库包括:

基于所述第一指数中的多元指标作为指标单元,构建第一指数对应的多元指标曲线;

使用sklearn估计器作为构建工具,将所述不同参照指数集中元素作为待构建数据,构建多元线性回归模型;

将所述第一指数对应的多元指标曲线与所述多元线性回归模型中的指标曲线进行对比,获取不同参照指数集中交叉点个数满足预设个数的指标曲线个数;

判断所述交叉点个数满足预设个数的指标曲线个数与其对应的参照指数集的指标曲线间的比值;

若所述比值满足预设比值阈值,则获取所述参照指数集中的装帧模板,构成第三装帧模板库。

为了解决上述技术问题,本申请实施例还提供了一种基于大数据的儿童读物类书籍装帧设计装置,采用了如下所述的技术方案:

一种基于大数据的儿童读物类书籍装帧设计装置,包括:

目标书籍处理模块,用于获取目标书籍的第一信息,进行第一统计,获取第一指数;

训练集构建模块,用于构建便于目标书籍进行装帧筛选的装帧模板训练集,包括步骤如下:

通过大数据的方式,获取海量装帧模板,构建第一装帧模板库;

通过大数据的方式,分别获取所述第一装帧模板库中不同装帧模板被装帧用户采纳的次数;

基于所述采纳次数和正态分布算法,获取满足预设概率阈值的采纳次数对应的不同装帧模板,构成第二装帧模块库;

通过大数据的方式,分别获取所述第二装帧模块库中不同装帧模板被装帧用户进行采纳时,使用所述装帧模板进行装帧的书籍的第一信息;

分别获取所述装帧模板进行装帧的书籍的第一指数,作为参照指数,使用数组的方式分别生成参照指数集;

分别获取所述第一指数在不同参照指数集中对应的占比率,若所述占比率满足预设阈值,获取与其对应的参照指数集,获取所述参照指数集中的装帧模板,构成第三装帧模板库,所述第三装帧模板库即为模板训练集;

优选模板构建模块,用于获取所述第三装帧模板库中不同装帧模板的文字样式、插图、色彩、纸质材料和版面信息,构成格式信息;对所述不同装帧模板的所述格式信息分别进行统计,分别选择被装帧模板使用概率最多的格式信息,作为优选模板的格式信息,生成优选模板;

书籍装帧模块,用于将所述优选模板作为目标书籍的装帧模板,进行线上模拟装帧。

为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:

一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现本申请实施例中提出的一种基于大数据的儿童读物类书籍装帧设计方法的步骤。

为了解决上述技术问题,本申请实施例还提供一种非易失性计算机可读存储介质,采用了如下所述的技术方案:

一种非易失性计算机可读存储介质,计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现本申请实施例中提出的一种基于大数据的儿童读物类书籍装帧设计方法的步骤。

与现有技术相比,本申请实施例主要有以下有益效果:

本申请实施例公开了基于大数据的儿童读物类书籍装帧设计方法、装置、设备及存储介质,通过获取目标书籍的第一信息,进行第一统计,获取第一指数;构建便于目标书籍进行装帧筛选的装帧模板训练集;获取训练集中不同装帧模板的文字样式、插图、色彩、纸质材料和版面信息,构成格式信息;对不同装帧模板的所述格式信息分别进行统计,分别选择被装帧模板使用概率最多的格式信息,作为优选模板的格式信息,生成优选模板;将优选模板作为目标书籍的装帧模板,进行线上模拟装帧。在装帧模板的选择上,直接从现有的装帧模板中构建训练集,通过目标书籍的第一信息进行最优模板选择,代替了现有技术中装帧模板线下设计的过程,既能选择出最合适的装帧模板,也能减少人力消耗。本申请有助于用户快速进行儿童读物类书籍装帧模板筛选,节省了人力物力和时间消耗,一定程度上简化了儿童读物类书籍装帧设计流程。

附图说明

为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例可以应用于其中的示例性系统架构图;

图2为本申请实施例中所述基于大数据的儿童读物类书籍装帧设计方法的一个实施例的流程图;

图3为本申请实施例中第二装帧模块库生成方法的一个实施例流程图;

图4为本申请实施例中第三装帧模块库生成方法的一个实施例流程图;

图5为本申请实施例中模板训练集生成方法的一个实施例流程图;

图6为本申请实施例中所述基于大数据的儿童读物类书籍装帧设计装置的一个实施例的结构示意图;

图7为本申请实施例中训练集构建模块的结构示意图;

图8为本申请实施例中计算机设备的一个实施例的结构示意图;

具体实施方式

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。

如图1所示,系统架构1可以包括终端设备1-1、1-2、1-3,网络1-4和服务器1-5。网络1-4用以在终端设备1-1、1-2、1-3和服务器1-5之间提供通信链路的介质。网络1-4可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备1-1、1-2、1-3通过网络1-4与服务器1-5交互,以接收或发送消息等。终端设备1-1、1-2、1-3上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备1-1、1-2、1-3可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器1-5可以是提供各种服务的服务器,例如对终端设备1-1、1-2、1-3上显示的页面提供支持的后台服务器。

需要说明的是,本申请实施例所提供的基于大数据的儿童读物类书籍装帧设计方法一般由服务器/终端设备执行,相应地,基于大数据的儿童读物类书籍装帧设计装置一般设置于服务器/终端设备中。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

继续参考图2,图中示出了本申请的基于大数据的儿童读物类书籍装帧设计方法的一个实施例的流程图,所述的基于大数据的儿童读物类书籍装帧设计方法包括以下步骤:

步骤2-1,获取目标书籍的第一信息,进行第一统计,获取第一指数。

在本实施例中,所述第一信息包括:所述目标书籍中的文字数量、章节数量、各章节文字数量、不同章节的段落数量、不同段落中的文字数量、句子数量、各句子中的文字数量、问句数量;所述目标书籍的作者或者主编姓名、书籍名称、出版社名称。

在本实施例中,所述进行第一统计,获取第一指数包括:分别对所述目标书籍中的文字数量、章节数量、各章节文字数量、不同章节的段落数量、不同段落中的文字数量、句子数量、各句子中的文字数量、问句数量进行统计,生成第一有序数组;获取所述目标书籍对应的作者或者主编姓名、书籍名称、出版社名称,对所述第一有序数组进行扩容,生成第二有序数组;将上述第二有序数组作为第一指数。

解释:在步骤2-1完成之后,实质上获取到一个包含N个元素的有序数组,N与所述第一信息中指标的个数相同,这个有序数组在本实施例中具体如下:[文字数量、章节数量、各章节文字数量、不同章节的段落数量、不同段落中的文字数量、句子数量、各句子中的文字数量、问句数量、作者或者主编姓名、书籍名称、出版社名称]。

步骤2-2,通过大数据的方式,获取海量装帧模板,构建第一装帧模板库。

在本实施例中,所述通过大数据的方式,获取海量装帧模板,构建第一装帧模板库包括:使用HTTrack抓取工具,以“书籍装帧模板”为抓取关键词组,获取包含不同书籍装帧模板的网址,通过所述网址在互联网上进行抓取,获取海量装帧模板,构建第一装帧模板库。

解释:所述HTTrack抓取工具直接适应与从互联网上在线抓取,保证了大数据量,抓取范围广。

解释:文中所述的装帧模板,专指书籍装帧设计模板,所述书籍装帧设计模板是指由书籍装帧设计师设计完成,发布到网上可供书籍装帧用户选择,直接套用的书籍装帧模板。

步骤2-3,通过大数据的方式,分别获取所述第一装帧模板库中不同装帧模板被装帧用户采纳的次数。

在本实施例中,所述通过大数据的方式,分别获取所述第一装帧模板库中不同装帧模板被装帧用户采纳的次数包括:使用ParseHub抓取工具,将所述第一装帧模板库中的不同装帧模板对应的网址作为目标网址,对目标网址中对应的内容进行页面解析,分别获取所述第一装帧模板库中不同装帧模板被装帧用户采纳的次数。

解释:所述ParseHub抓取工具通过目标网址,获取页面内容,对所述获取到的页面内容进行DOM解析,获取到所述第一装帧模板库中不同装帧模板被装帧用户采纳的次数对应的页面标签,从而获取到所述次数。

步骤2-4,基于所述采纳次数和正态分布算法,获取满足预设概率阈值的采纳次数对应的不同装帧模板,构成第二装帧模块库。

在本申请实施例中,所述基于所述采纳次数和正态分布算法,获取满足预设概率阈值的采纳次数对应的不同装帧模板,构成第二装帧模块库包括:基于JFreeChart绘图工具,对所述第一装帧模板库中不同装帧模板被装帧用户采纳的次数,构建条形分布图;对所述条形分布图中条形图进行谷-峰-谷调整,构成符合正态分布的条形分布图,并获取其对应的正态分布曲线;获取在[-1σ,1σ]范围内,所述正态分布曲线对应的满足预设概率阈值的条形分布图;通过所述满足预设概率阈值的条形分布图分别获取其对应的装帧模板,以所述装帧模板作为元素,构建第二装帧模块库。

具体参考图3,图3为本申请实施例中第二装帧模块库生成方法的一个实施例流程图,具体包括步骤如下:

步骤3-1,基于JFreeChart绘图工具,对所述第一装帧模板库中不同装帧模板被装帧用户采纳的次数,构建条形分布图;

解释:在本步骤中,使用可视化的JFreeChart绘图工具,所述第一装帧模板库中每一个装帧模板被装帧用户采纳的次数都构建一个条形图,整合为一张条形分布图。

步骤3-2,对所述条形分布图中条形图进行谷-峰-谷调整,构成符合正态分布的条形分布图,并获取其对应的正态分布曲线;

解释:所述进行谷-峰-谷调整即,对所述条形分布图中不同的条形图进行调整,将最中间位置的条形图对应被装帧用户采纳的次数最多的装帧模板,有中间位置向左右两边,所述条形图对应被装帧用户采纳的次数依次递减,构成一个符合正态分布曲线的条形分布图;然后,根据所述条形分布图,获取其对应的正态分布曲线。

步骤3-3,获取在[-1σ,1σ]范围内,所述正态分布曲线对应的满足预设概率阈值的条形分布图;

解释:在本申请实施例中,获取在[-1σ,1σ]范围内的条形图,实质上是获取到了67%的被装帧用户采纳的次数相对较多的装帧模板,将剩余33%的被装帧用户采纳的次数相对较小的装帧模板给筛选了出去。

此外,所述的[-1σ,1σ]范围内,可以根据实际的需要在[-1,1]范围内进行调整,例如:获取[-0.5σ,0.5σ]范围内,所述正态分布曲线对应的满足预设概率阈值的条形分布图,则说明获取的范围更精确。

步骤3-4,通过所述满足预设概率阈值的条形分布图分别获取其对应的装帧模板,以所述装帧模板作为元素,构建第二装帧模块库。

步骤2-5,通过大数据的方式,分别获取所述第二装帧模块库中不同装帧模板被装帧用户进行采纳时,使用所述装帧模板进行装帧的书籍的第一信息。

在本申请实施例中,所述通过大数据的方式,分别获取所述第二装帧模块库中不同装帧模板被装帧用户进行采纳时,使用所述装帧模板进行装帧的书籍的第一信息具体包括:基于所述第二装帧模块库中不同装帧模板被装帧用户进行采纳的日志信息,分别获取所述第二装帧模块库中不同装帧模板被装帧用户进行采纳时,使用所述装帧模板进行装帧的书籍的第一信息。

解释:本步骤的获取方式如下:在确定所述第二装帧模块库中不同装帧模板被装帧用户进行采纳时,获取使用所述装帧模板进行装帧的书籍的第一信息,先获取使用所述装帧模板进行装帧的书籍名称,通过书籍名称,获取到所述书籍对应的文字数量、章节数量、各章节文字数量、不同章节的段落数量、不同段落中的文字数量、句子数量、各句子中的文字数量、问句数量、作者或者主编姓名、出版社名称。

步骤2-6,分别获取所述装帧模板进行装帧的书籍的第一指数,作为参照指数,使用数组的方式分别生成参照指数集。

解释:同理,使用步骤2-1中获取目标书籍第一指数的方式,分别获取所述装帧模板进行装帧的书籍的第一指数,作为参照指数,使用数组的方式分别生成参照指数集。

步骤2-7,分别获取所述第一指数在不同参照指数集中对应的占比率,若所述占比率满足预设阈值,获取与其对应的参照指数集,获取所述参照指数集中的装帧模板,构成第三装帧模板库。

在本申请实施例中,所述分别获取所述第一指数在不同参照指数集中对应的占比率,若所述占比率满足预设阈值,获取与其对应的参照指数集,获取所述参照指数集中的装帧模板,构成第三装帧模板库包括:基于所述第一指数中的多元指标作为指标单元,构建第一指数对应的多元指标曲线;使用sklearn估计器作为构建工具,将所述不同参照指数集中元素作为待构建数据,构建多元线性回归模型;将所述第一指数对应的多元指标曲线与所述多元线性回归模型中的指标曲线进行对比,获取不同参照指数集中交叉点个数满足预设个数的指标曲线个数;判断所述交叉点个数满足预设个数的指标曲线个数与其对应的参照指数集的指标曲线间的比值;若所述比值满足预设比值阈值,则获取所述参照指数集中的装帧模板,构成第三装帧模板库。

具体参考图4,图4为本申请实施例中第三装帧模块库生成方法的一个实施例流程图,具体包括步骤如下:

步骤4-1,基于所述第一指数中的多元指标作为指标单元,构建第一指数对应的多元指标曲线;

解释:所述第一指数为所述目标书籍在步骤2-1完成之后获取到第一指数,实质为一个有序数组,将所述有序数组中的每一个元素分别作为一个指标,构建多元指标曲线。

步骤4-2,使用sklearn估计器作为构建工具,将所述不同参照指数集中元素作为待构建数据,构建多元线性回归模型;

解释:所述sklearn估计器,主要目的是通过预设的数据集,构建多元线性回归模型,在本申请实施例中,将所述不同参照指数集中元素作为待构建数据,实质上所述不同参照指数集中元素分别为一个个多元有序数组,即每一个元素都能构建一条多元指标曲线,则所述每一个参照指数集都构建成一个包含若干条多元指标曲线的多元线性回归模型。

步骤4-3,将所述第一指数对应的多元指标曲线与所述多元线性回归模型中的指标曲线进行对比,获取不同参照指数集中交叉点个数满足预设个数的指标曲线个数;

解释:将所述第一指数对应的多元指标曲线与所述多元线性回归模型中的指标曲线进行对比,即曲线与曲线间的对比,获取两者间的交叉点,若预设交叉点的阈值为10个,则判断在进行对比之后,每一个参照指数集构建成的多元线性回归模型与所述第一指数对应的多元指标曲线交叉点超过10个的曲线数量。

步骤4-4,判断所述交叉点个数满足预设个数的指标曲线个数与其对应的参照指数集的指标曲线间的比值;

解释:判断满足预设阈值的曲线数量占其所在参照指数集中个数的比值。

例如:经过步骤4-3获取到当前参照指数集构建成的多元线性回归模型与所述第一指数对应的多元指标曲线交叉点超过10个的曲线数量为210个,当前参照指数集元素的数量为300个,则所述比值为70%。

步骤4-5,若所述比值满足预设比值阈值,则获取所述参照指数集中的装帧模板,构成第三装帧模板库。

解释:本申请实施例中,假设预设比值阈值为90%,所述步骤4-4中所述比值为70%,则不满足,即筛选并剔除出当前参照指数集;若所述步骤4-4中所述比值为95%,则满足,即筛选出当前参照指数集,并将所述当前参照指数集中元素对应的装帧模板加入到第三装帧模板库。

步骤2-8,获取所述第三装帧模板库中不同装帧模板的文字样式,插图,色彩,纸质材料和版面信息,构成格式信息。

步骤2-9,对所述不同装帧模板的所述格式信息分别进行统计,分别选择被装帧模板使用概率最多的格式信息,作为优选模板的格式信息,生成优选模板。

在本申请实施例中,所述分别选择被装帧模板使用概率最多的格式信息,作为优选模板的格式信息包括:对所述第三装帧模板库中不同装帧模板使用的文字样式进行统计,获取被使用占比最多的文字样式,作为优选文字样式;同理,分别获取到优选插图、优选色彩、优选纸质材料、优选版面信息;最后,将获取到的优选文字样式、优选插图、优选色彩、优选纸质材料、优选版面信息作为优选格式信息,生成优选模板,即优选装帧模板。

步骤2-10,将所述优选模板作为目标书籍的装帧模板,进行线上模拟装帧。

具体参考图5,图5为本申请实施例中模板训练集生成方法的一个实施例流程图,具体包括步骤如下:

步骤5-1,通过大数据的方式,获取海量装帧模板,构建第一装帧模板库;

步骤5-2,通过大数据的方式,分别获取所述第一装帧模板库中不同装帧模板被装帧用户采纳的次数;

步骤5-3,基于所述采纳次数和正态分布算法,获取满足预设概率阈值的采纳次数对应的不同装帧模板,构成第二装帧模块库;

步骤5-4,通过大数据的方式,分别获取所述第二装帧模块库中不同装帧模板被装帧用户进行采纳时,使用所述装帧模板进行装帧的书籍的第一信息;

步骤5-5,分别获取所述装帧模板进行装帧的书籍的第一指数,作为参照指数,使用数组的方式分别生成参照指数集;

步骤5-6,分别获取所述第一指数在不同参照指数集中对应的占比率,若所述占比率满足预设阈值,获取与其对应的参照指数集,获取所述参照指数集中的装帧模板,构成第三装帧模板库,所述第三装帧模板库即为模板训练集。

本申请实施例中所述的基于大数据的儿童读物类书籍装帧设计方法,可以通过获取目标书籍的第一信息,进行第一统计,获取第一指数;构建便于目标书籍进行装帧筛选的装帧模板训练集;获取训练集中不同装帧模板的文字样式、插图、色彩、纸质材料和版面信息,构成格式信息;对不同装帧模板的所述格式信息分别进行统计,分别选择被装帧模板使用概率最多的格式信息,作为优选模板的格式信息,生成优选模板;将优选模板作为目标书籍的装帧模板,进行线上模拟装帧。本申请有助于用户快速进行儿童读物类书籍装帧模板筛选,节省了人力物力和时间消耗,一定程度上简化了儿童读物类书籍装帧设计流程。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图6,作为对上述图2所示方法的实现,本申请提供了一种基于大数据的儿童读物类书籍装帧设计装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图6所示,本实施例所述的基于大数据的儿童读物类书籍装帧设计装置6包括:目标书籍处理模块6-1、训练集构建模块6-2、优选模板构建模块6-3和书籍装帧模块6-4。其中:

目标书籍处理模块6-1,用于获取目标书籍的第一信息,进行第一统计,获取第一指数;

训练集构建模块6-2,用于构建便于目标书籍进行装帧筛选的装帧模板训练集,包括步骤如下:

通过大数据的方式,获取海量装帧模板,构建第一装帧模板库;

通过大数据的方式,分别获取所述第一装帧模板库中不同装帧模板被装帧用户采纳的次数;

基于所述采纳次数和正态分布算法,获取满足预设概率阈值的采纳次数对应的不同装帧模板,构成第二装帧模块库;

通过大数据的方式,分别获取所述第二装帧模块库中不同装帧模板被装帧用户进行采纳时,使用所述装帧模板进行装帧的书籍的第一信息;

分别获取所述装帧模板进行装帧的书籍的第一指数,作为参照指数,使用数组的方式分别生成参照指数集;

分别获取所述第一指数在不同参照指数集中对应的占比率,若所述占比率满足预设阈值,获取与其对应的参照指数集,获取所述参照指数集中的装帧模板,构成第三装帧模板库,所述第三装帧模板库即为模板训练集。

优选模板构建模块6-3,用于获取所述第三装帧模板库中不同装帧模板的文字样式、插图、色彩、纸质材料和版面信息,构成格式信息;对所述不同装帧模板的所述格式信息分别进行统计,分别选择被装帧模板使用概率最多的格式信息,作为优选模板的格式信息,生成优选模板;

书籍装帧模块6-4,用于将所述优选模板作为目标书籍的装帧模板,进行线上模拟装帧。

在本申请的一些实施例中,如图7,图7为本申请实施例中训练集构建模块的结构示意图,所述训练集构建模块6-2包括第一装帧模板库构建单元6-2a、第二装帧模板库构建单元6-2b、第三装帧模板库构建单元6-2c。

在本申请的一些实施例中,所述第一装帧模板库构建单元6-2a用于通过大数据的方式,获取海量装帧模板,构建第一装帧模板库,具体为使用HTTrack抓取工具,以“书籍装帧模板”为抓取关键词组,获取包含不同书籍装帧模板的网址,通过所述网址在互联网上进行抓取,获取海量装帧模板,构建第一装帧模板库。

在本申请的一些实施例中,所述第二装帧模板库构建单元6-2b用于通过大数据的方式,分别获取所述第一装帧模板库中不同装帧模板被装帧用户采纳的次数;基于所述采纳次数和正态分布算法,获取满足预设概率阈值的采纳次数对应的不同装帧模板,构成第二装帧模块库。

在本申请的一些实施例中,所述第三装帧模板库构建单元6-2c用于通过大数据的方式,分别获取所述第二装帧模块库中不同装帧模板被装帧用户进行采纳时,使用所述装帧模板进行装帧的书籍的第一信息;分别获取所述装帧模板进行装帧的书籍的第一指数,作为参照指数,使用数组的方式分别生成参照指数集;分别获取所述第一指数在不同参照指数集中对应的占比率,若所述占比率满足预设阈值,获取与其对应的参照指数集,获取所述参照指数集中的装帧模板,构成第三装帧模板库,所述第三装帧模板库即为模板训练集。

本申请实施例所述的基于大数据的儿童读物类书籍装帧设计装置,通过目标书籍处理模块获取目标书籍的第一信息,进行第一统计,获取第一指数;通过训练集构建模块构建便于目标书籍进行装帧筛选的装帧模板训练集;通优选模板构建模块过获取训练集中不同装帧模板的文字样式、插图、色彩、纸质材料和版面信息,构成格式信息;对不同装帧模板的所述格式信息分别进行统计,分别选择被装帧模板使用概率最多的格式信息,作为优选模板的格式信息,生成优选模板;通过书籍装帧模块将优选模板作为目标书籍的装帧模板,进行线上模拟装帧。本申请有助于用户快速进行儿童读物类书籍装帧模板筛选,节省了人力物力和时间消耗,一定程度上简化了儿童读物类书籍装帧设计流程。

为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图8,图8为本实施例计算机设备基本结构框图。

所述计算机设备8包括通过系统总线相互通信连接存储器8-1、处理器8-2、网络接口8-3。需要指出的是,图中仅示出了具有组件8-1、8-2、8-3的计算机设备8,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器8-1至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器8-1可以是所述计算机设备8的内部存储单元,例如该计算机设备8的硬盘或内存。在另一些实施例中,所述存储器8-1也可以是所述计算机设备8的外部存储设备,例如该计算机设备8上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器8-1还可以既包括所述计算机设备8的内部存储单元也包括其外部存储设备。本实施例中,所述存储器8-1通常用于存储安装于所述计算机设备8的操作系统和各类应用软件,例如基于大数据的儿童读物类书籍装帧设计方法的程序代码等。此外,所述存储器8-1还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器8-2在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器8-2通常用于控制所述计算机设备8的总体操作。本实施例中,所述处理器8-2用于运行所述存储器8-1中存储的程序代码或者处理数据,例如运行所述基于大数据的儿童读物类书籍装帧设计方法的程序代码。

所述网络接口8-3可包括无线网络接口或有线网络接口,该网络接口8-3通常用于在所述计算机设备8与其他电子设备之间建立通信连接。

本申请还提供了另一种实施方式,即提供一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有基于大数据的儿童读物类书籍装帧设计程序,所述基于大数据的儿童读物类书籍装帧设计程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的基于大数据的儿童读物类书籍装帧设计方法的步骤。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。

显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号