首页> 中国专利> 一种在线自动图文本排版系统及其排版方法

一种在线自动图文本排版系统及其排版方法

摘要

本发明公开一种在线自动图文本排版系统及其排版方法,包括客户终端和后台服务器,所述客户终端同后台服务器建立通信连接;所述客户终端包括浏览器,还包括在线排版的前台模块和在线管理模块;所述在线排版的前台模块内设有按键;所述后台服务器包括HTTP监听模块、弹性计算服务模块和数据存储模块;所述HTTP监听模块与弹性计算服务模块形成通信连接;所述弹性计算服务模块包括IIS_HTTP服务端、业务处理模块和数据访问模块;所述IIS_HTTP服务端与业务处理模块建立通信连接。该发明采用Browser/Server结构,客户无需安装客户端软件,只需使用浏览器即可,省去来学习客户端软件安装和使用过程;提供丰富的模版供客户选择;做到一键成书。

著录项

  • 公开/公告号CN106407173A

    专利类型发明专利

  • 公开/公告日2017-02-15

    原文格式PDF

  • 申请/专利权人 南京美珀曼文化科技有限公司;

    申请/专利号CN201610842260.2

  • 发明设计人 左国威;

    申请日2016-09-22

  • 分类号G06F17/25;G06F17/30;H04L29/08;

  • 代理机构北京轻创知识产权代理有限公司;

  • 代理人谈杰

  • 地址 211113 江苏省南京市江宁区禄口街道工业园区神舟路37号

  • 入库时间 2023-06-19 01:32:41

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-10-08

    授权

    授权

  • 2017-03-15

    实质审查的生效 IPC(主分类):G06F17/25 申请日:20160922

    实质审查的生效

  • 2017-02-15

    公开

    公开

说明书

技术领域

本发明涉及一种图文本排版系统,特别是涉及一种在线自动图文本排版系统及其排版方法。

背景技术

目前线上排版系统没有成熟的产品,百度搜索结果,一般只是在一个web网页文本框上拷贝粘贴文字,简单设置字体字号等,然后点击按钮就开始排版,输出保存文字。

此类系统,没有模板库供选择,样式设置单一,不能满足客户的多样化、个性化选择需要;对输入文档要求过高,对结构标志不严格、松散的文档不能做到智能识别文档结构层次,抓取文本内容进行排版;输出文本达不到出版高品质要求,甚至出现较多内容错误,满足不了客户的需求;一般是文本文件或word文档,输出文档格式也单一,一般是word、PDF,与其说是排版,不如说是一个简单的转化工具,没有排版的概念。

发明内容

本发明的目的旨在克服现有技术的不足,提供一种在线自动图文本排版系统及其排版方法,采用Browser/Server架构,针对不同的文本格式、结构松散的文档进行内容智能自动识别读取、排版,满足各类客户多样化、个性化、高品质排版需求。

1.一种在线自动图文本排版系统,其特征在于,包括客户终端和后台服务器,所述客户终端同后台服务器建立通信连接;所述客户终端包括浏览器,还包括在线排版的前台模块和在线管理模块;所述在线排版的前台模块内设有按键;

所述后台服务器包括HTTP监听模块、弹性计算服务模块和数据存储模块;所述HTTP监听模块与弹性计算服务模块形成通信连接;所述弹性计算服务模块包括IIS_HTTP服务端、业务处理模块和数据访问模块;所述IIS_HTTP服务端与业务处理模块建立通信连接,所述业务处理模块与数据访问模块之间形成通信连接;

所述业务处理模块包括账户管理模块、模板管理模块、正文及附件设计模块、基于indd/pdf/txt/word/epub的数据智能抓取模块和基于indd/pdf/txt/word/epub的输出模块;所述数据访问模块包括数据库API和基于indesign的word/pdf/epub/txt引擎模块;所述数据存储模块包括数据库模块和文件储存模块,所述数据库模块用来存放用户名、密码和用户允许访问的文件的文件标识;

所述数据库API与所述数据库模块建立通信连接,所述基于indesign的word/pdf/epub/txt引擎模块与文件储存模块之间形成通信连接,所述文件储存模块中储存有同数据库模块中的文件标识对应的文件。

进一步地,所述按键为一键成书按键,即启动所述按键,运行后台服务器开始图文排版,并生成所需格式的文件。

进一步地,所述基于indesign的word/pdf/epub/txt引擎模块为基于indesign对word,pdf,epub,txt相互之间进行格式转换的引擎模块。

进一步地,所述HTTP监听模块组件包括第一HTTP监听模块、第二HTTP监听模块…第nHTTP监听模块,n为大于零的整数,表示所述HTTP监听模块组件中HTTP监听模块的数量。

进一步地,所述弹性计算服务模块组件包括第一弹性计算服务模块、第二弹性计算服务模块…第m弹性计算服务模块,m为大于零的整数,表示所述弹性计算服务模块组件中弹性计算服务模块的数量。

进一步地,所述数据库模块组件包括第一数据库模块、第二数据库模块…第k数据库模块,k为大于零的整数,表示所述数据模块组件中数据模块的数量。

进一步地,所述文件储存模块组件包括第一文件储存模块、第二文件储存模块…第g文件储存模块,g为大于零的整数,表示文件储存模块组件中文件储存模块的数量。

进一步地,在线自动图文本排版系统的排版方法如下:

(1)运行所述客户终端中的浏览器,用户注册并登录,输入原始文档的信息,启动按键,向HTTP监听模块发出请求;

(2)所述IIS_HTTP服务端收到HTTP监听模块传输的信息后,将信息传出于业务模块,业务模块中的账户管理模块对用户名、密码及用户能够访问的文件标识进行采集;同时,模板管理模块采集与用户能够访问的文件标识相对应的文件;账户管理模块和模板管理模块将采集到的信息传输于数据库API,然后分别存储于数据库模块和文件存储模块中;

(3)所述数据库API将接收到的用户文件格式请求反馈于正文及附件设计模块,正文及附件设计模块将此信息传输给基于indesign的word/pdf/epub/txt引擎模块,所述基于indesign的word/pdf/epub/txt引擎模块接收到信息后,调动基于indd/pdf/txt/word/epub的数据智能抓取模块,对所需文件模板的数据进行抓取,然后通过基于indesign的word/pdf/epub/txt引擎模块进行格式的转换,反馈给正文及附件设计模块,此时正文及附件设计模块再对新的文件格式进行包括针对正文、封面、序言或者目录的格式进行版面设计,并传输给基于indesign的word/pdf/epub/txt引擎模块;

(4)基于indesign的word/pdf/epub/txt引擎模块将接收到的设计好的文件传输给基于indd/pdf/ txt/word/epub的输出模块,发出相应信息传输至在线管理模块,所述在线管理模块将显示信息、输出文件传递给客户终端进行显示。

所述的基于indd/pdf/txt/word/epub的数据智能抓取模块对所需文件模板的数据进行抓取运用到包括以下一种或几种算法:

算法1: Bayes Classifier 贝叶斯分类

采用共现分析的方法,从文档中获取包括文字、图像、段落和标题之间的关系,并应用到文档元素分类中,获取到一个基于贝叶斯网络的结构化文档模型,通过计算概率、完成对文档元素分类和连接。

算法2:Principle Component Analysis 主成份分析

采用主成分析方法,首先对包括文字、图像、段落和标题数据进行归一化处理,将不同类型和尺度的数据分别规约到同一范围,在此基础上,计算出样本在整个数据集合中的权值,接着对归一化后的数据进行均值化或去均值处理,从而获取到主成分,进而达到文档元素分类和连接

算法3:Wavelet analysis小波分析

基于小波分析,提取包括文本文字、图像、段落、标题和样式特征,降维、除噪,构建相应特征空间,在特征空间以及空间关系对应基础上,进行文档元素分类和连接。

本发明的有益效果是:(1)排版各种类型文档,覆盖了主流文档类型,不同类型的文档,通过本产品排版,产生不同类型的文档输出,满足不同的需求;(2)技术上采用Browser/Server结构,客户无需安装客户端软件,只需使用浏览器即可,省去来学习客户端软件安装和使用过程;(3)提供丰富的模版供客户选择,满足客户多样化、个性化的需求;(4)做到一键成书,用户体验极致简单、易用,大量节省人工成本,对人员专业技能要求较低,可大幅度提高排版效率。

具体实施方式

下面结合具体实施例,进一步阐明本发明。

实施例

一种在线自动图文本排版系统,包括客户终端和后台服务器,所述客户终端同后台服务器建立通信连接;所述客户终端包括浏览器,还包括在线排版的前台模块和在线管理模块;所述在线排版的前台模块内设有按键,所述按键为一键成书按键,即启动所述按键,运行后台服务器开始图文排版,并生成所需格式的文件;

所述后台服务器包括HTTP监听模块、ECS弹性计算服务模块和数据存储模块;所述HTTP监听模块与ECS弹性计算服务模块形成通信连接;所述HTTP监听模块组件包括第一HTTP监听模块和第二HTTP监听模块;所述第一HTTP监听模块和第二HTTP监听模块同时工作,起到负荷分担的作用。所述ECS弹性计算服务模块组件包括第一ECS弹性计算服务模块、第二ECS弹性计算服务模块和第三ECS弹性计算服务模块;所述ECS弹性计算服务模块包括IIS_HTTP服务端、业务处理模块和数据访问模块;所述IIS_HTTP服务端与业务处理模块建立通信连接,所述业务处理模块与数据访问模块之间形成通信连接。

所述业务处理模块包括账户管理模块、模板管理模块、正文及附件设计模块、基于indd/pdf/txt/word/epub的数据智能抓取模块和基于indd/pdf/txt/word/epub的输出模块;所述数据访问模块包括ADO.NET数据库API和基于indesign的word/pdf/epub/txt引擎模块,所述基于indesign的word/pdf/epub/txt引擎模块为基于indesign对word,pdf,epub,txt进行格式转换的引擎模块;所述数据存储模块包括微软Azure_SQL数据库模块和阿里云OSS文件储存模块,

所述ADO.NET数据库API与所述微软Azure_SQL数据库模块建立通信连接,所述基于indesign的word/pdf/epub/txt引擎模块与阿里云OSS文件储存模块之间形成通信连接。所述微软Azure_SQL数据库模块组件包括第一微软Azure_SQL数据库模块和第二微软Azure_SQL数据库模块;所述阿里云OSS文件储存模块组件包括第一阿里云OSS文件储存模块和第二阿里云OSS文件储存模块。

所述微软Azure_SQL数据库模块用于存放用户名、密码和用户允许访问的文件的文件标识。

所述阿里云OSS文件储存模块中储存有同数据库模块中的文件标识对应的文件。

如图1所示,在线自动图文本排版系统的排版原理和方法如下:

(1)运行所述客户终端中的浏览器,用户注册并登录,输入原始文档的信息,启动按键,向HTTP监听模块发出请求;

(2)所述IIS_HTTP服务端收到HTTP监听模块传输的信息后,将信息传出于业务模块,业务模块中的账户管理模块对用户名、密码、手机号码、用户ID及用户能够访问的文件标识进行采集;同时,模板管理模块采集与用户能够访问的文件标识相对应的文件,包括文件的原始模板、字体和颜色;账户管理模块和模板管理模块将采集到的信息传输于ADO.NET数据库API,然后分别存储于微软Azure_SQL数据库模块和阿里云OSS文件存储模块中;

(3)所述ADO.NET数据库API将接收到的用户文件格式请求反馈于正文及附件设计模块,正文及附件设计模块将此信息传输给基于indesign的word/pdf/ epub/txt引擎模块,所述基于indesign的word/pdf/epub/txt引擎模块接收到信息后,调动基于indd/pdf/txt/word/epub的数据智能抓取模块,对所需文件模板的数据进行抓取,然后通过基于indesign的word/pdf/epub/txt引擎模块进行格式的转换,反馈给正文及附件设计模块,此时正文及附件设计模块再对新的文件格式进行包括针对正文、封面、序言或者目录的格式进行版面设计,并传输给基于indesign的word/pdf/epub/txt引擎模块;

(4)基于indesign的word/pdf/epub/txt引擎模块将接收到的设计好的文件传输给基于indd/pdf/ txt/word/epub的输出模块,发出相应信息传输至在线管理模块,所述在线管理模块将显示信息、输出文件传递给客户终端进行显示。

所述的基于indd/pdf/txt/word/epub的数据智能抓取模块对所需文件模板的数据进行抓取运用到包括以下一种或几种算法:

算法1: Bayes Classifier 贝叶斯分类

采用共现分析的方法,从文档中获取包括文字、图像、段落和标题之间的关系,并应用到文档元素分类中,获取到一个基于贝叶斯网络的结构化文档模型,通过计算概率、完成对文档元素分类和连接。

算法2:Principle Component Analysis 主成份分析

采用主成分析方法,首先对包括文字、图像、段落和标题数据进行归一化处理,将不同类型和尺度的数据分别规约到同一范围,在此基础上,计算出样本在整个数据集合中的权值,接着对归一化后的数据进行均值化或去均值处理,从而获取到主成分,进而达到文档元素分类和连接

算法3:Wavelet analysis小波分析

基于小波分析,提取包括文本文字、图像、段落、标题和样式特征,降维、除噪,构建相应特征空间,在特征空间以及空间关系对应基础上,进行文档元素分类和连接。

总之,该在线自动图文排版系统可对各种类型文档进行排版,不同类型的文档,通过本产品排版,产生不同类型的文档输出,满足不同的需求;提供丰富的模版供客户选择,满足客户多样化、个性化的需求;做到一键成书,用户体验极致简单、易用,大量节省人工成本。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号