首页> 中国专利> WORD内容批量拷贝到基于S1000D标准DM的快速转换方法

WORD内容批量拷贝到基于S1000D标准DM的快速转换方法

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明涉及WORD内容批量拷贝到基于S1000D标准DM的快速转换方法，属于数据格式内容转换领域，包括以下步骤：文档html化；判断是否从word文档中复制，若是，则核对是否为注册word粘贴命令，若不是，则调用普通转换操作；判断当前光标是否定位在编辑区节点；获取粘贴命令的对象；启动多线程处理；根据各线程处理时间判定是否结束线程；获取模板信息；往Transformer转换对象中设置必要参数，转换成S1000D标准DM的Xml文件。本发明通过模板引擎能够把word中的标题、强调、上下标、有序、无序、表格、图片、图标、文本等内容自动转换成S1000D对应内容，提升编辑效率。

著录项

公开/公告号CN112699641A

专利类型发明专利
公开/公告日2021-04-23

原文格式PDF
申请/专利权人南京国睿信维软件有限公司;
展开▼

申请/专利号CN202110316627.8
发明设计人孙国防;蒋巍;孙浩;
展开▼

申请日2021-03-25
分类号G06F40/151(20200101);G06F40/186(20200101);
代理机构32273 南京苏创专利代理事务所(普通合伙);
代理人凤婷
地址 210013 江苏省南京市鼓楼区古平岗4号院53号楼7楼
入库时间 2023-06-19 10:43:23

说明书

技术领域

本发明涉及一种word内容批量拷贝到基于S1000D标准DM的快速转换方法，属于数据智能处理技术领域。

背景技术

S1000D标准DM以Xml格式定义。编制S1000D标准手册时，所有DM最终都必须以Xml文件保存。IETM手册在国内普及之前，大多数用户已经有以word文档形式编写好的手册数据。

为将原有手册内容转成S1000D标准的IETM手册数据，传统方式是在编写DM的过程中将word中的内容通过复制、粘贴等方式转录成Xml格式。这种方式无法充分复用原有资料，编写效率低，准确率低。

发明内容

为了解决上述技术问题，本发明提供一种WORD内容批量拷贝到基于S1000D标准DM的快速转换方法，包括如下步骤：

步骤1：文档html化：对文档全文进行html标签语言的文本化，输出html标签语言文本；

步骤2：根据步骤1中所得html标签语言文本判断是否来源于word文档，若是，则进入步骤3，若不是，则调用普通转换操作；

步骤3：核对html标签语言文本是否为已注册的word粘贴命令，若否，则把word粘贴命令注册到缓存的命令集合中，然后进入步骤4，若是，则直接进入步骤4；

步骤4：判断当前光标是否定位在编辑区节点中，若否，则警告提示，若是，则进入步骤5；

步骤5：获取word需要粘贴的对象，执行粘贴命令，并且初始化xslt样式模板；

步骤6：启动多线程操作，对粘贴后的html标签语言文本进行裁剪、调整或者删除不必要的内容，为转换S1000D节点做准备；

步骤7：若当前线程能在1秒内处理完源数据，则不弹出日志对话框，若超过1秒还没有执行完，则结束当前线程，弹出操作日志对话框；

步骤8：根据xslt样式文件路径获取样式模板，若缓存中有样式模板信息，则默认样式模板信息从缓存中取，若缓存中没有样式模板信息，则把样式模板信息存入到缓存中，需要模板信息时直接从缓存中取；

步骤9：通过样式模板获取Transformer转换对象，再往Transformer转换对象中设置必要参数，转换成S1000D标准DM的Xml文件。

进一步的，所述步骤1中通过键盘“CTRL+C/CTRL+V”触发复制/粘贴命令，将文档内容复制到剪切板中，设置文档数据格式为html格式，通过Transformer转换对象获取剪切板中html格式内容。

进一步的，所述步骤2中根据底层html数据中的“xmlns:w=urn:schemas-microsoft-com:office:WORD”信息来判断html标签语言文本是否从word文档中复制。

进一步的，所述步骤6的多线程操作的具体执行过程为：

步骤6.1：把html标签语言文本中字符串转成Document对象进行解析，并删除html标签语言文本中的命名空间及注释内容，再把图片内容下载到本地临时文件夹，普通图片用png格式保存，VISIO格式用EMF压缩格式保存，文件命名格式为“image”+编号；

步骤6.2：删除html标签语言文本中底层对应的meta多余标签内容，删除全局字体相关的样式；

步骤6.3：删除原word纯文本内容样式、有序列表、无序列表样式及文本布局格式，修改语言为“zh-CN”格式；

步骤6.4：删除底层原word文档全文中的链接样式；

步骤6.5：根据原word文档底层表格列宽，修改为用百分比表示列宽，增加处理指令，用来预处理按照S1000D标准标签表示的表格；

步骤6.6：修改图片标签，把原word文档中的底层标签改为

WORD内容批量拷贝到基于S1000D标准DM的快速转换方法

摘要

著录项

说明书

相似文献