首页> 中国专利> 一种PPT数据报告的自动生成方法

一种PPT数据报告的自动生成方法

摘要

本发明公开了一种PPT数据报告的自动生成方法,属于自动化办公技术领域。该方法包括:步骤(1)获取使用场景的目标原始数据记录,其中目标原始数据记录包括信息字段和文件资源字段;步骤(2)设计数据报告模板,并将所述数据报告模板定义为通用PPT模板样式,所述通用PPT模板样式包括对应于所述信息字段的区域和对应于所述文件资源字段的区域;步骤(3)在所述通用PPT模板样式内进行数据标记,所述数据标记用于建立所述通用PPT模板样式与待展示的数据之间的联系;步骤(4)设置通用PPT模板样式的参数;步骤(5)读取所述数据报告模板,识别其数据标记并在数据库内进行自动查找,随后填充到指定的位置。

著录项

  • 公开/公告号CN112883692A

    专利类型发明专利

  • 公开/公告日2021-06-01

    原文格式PDF

  • 申请/专利权人 广州超深信息技术有限公司;

    申请/专利号CN202011142971.1

  • 发明设计人 东栋;

    申请日2020-10-23

  • 分类号G06F40/166(20200101);G06F40/186(20200101);

  • 代理机构44572 广州正明知识产权代理事务所(普通合伙);

  • 代理人成姗

  • 地址 510000 广东省广州市荔湾区花地大道中228号2层2025-5室

  • 入库时间 2023-06-19 11:11:32

说明书

技术领域

本发明属于自动化办公技术领域,具体地说,涉及一种PPT数据报告的自动生成方法。

背景技术

办公自动化、无纸化提了许多年,实际上真正起到作用只是资料的复制、获得等方面的效率提升。办公软件制作报告的形式的变化明显,但模式上,仍然是以人在电脑面前的操作为主。大量的资料整合、信息同步、转换、校对还是人工进行。随着时代对海量数据的需求,人工出错的问题也更突出,各个系统间的数据转换常常引入人工错误,版本控制困难,相互协同困难,反应时间缓慢,浪费大量人力,工作常常是越是提倡办公自动化越是需要更多人力参与,投入成本高,且工作效率低。常用的微软OFFICE办公自动化软件的所谓自动化,还主要体现在人机界面的优化。对于进一步的跨软件代替人们查找、复制、粘贴等操作的自动化,由于各个领域的业务千差万别,无法统一提供。

常规的自动报告生成系统,不仅需要专用的软件开发,而且需要业务部门改变现有的业务模式和习惯,学习软件的使用,或者转换现有的数据,把现有的数据输入到系统中,然后生成报告。这样对现有业务的影响较大,系统的引入本身也会带来额外的工作量。另外,业务总是不断变化的,专用的软件需要不断的更改适应业务的变化。对于中大型集团公司而言,每年有大量同类型数据需要分析,例如同一项目在不同子公司的实施程度、实施效果等,需要进行多维度的数据分析。集团公司通常需要从报表中提取省份的各种统计数据,通过人工进一步整理,生成Office通告文档下发各省份,以便集中管理。具体来说,大型项目运营分析自动化通常是将生成Office通告文档以附件的形式加载到告警邮件或告警短信中,所以要求制作Office通告文档,而现有常用的一种制作方法是:通过先把各分子公司报表中数据导出到Excel模板文档并人工根据导出的数据在Excel中制作图形,然后人工编写PPT报告,同时插入Excel中制作的图形和文字性总结,生成PPT报告。但这些数据需要根据集团分支结构层级的情况,先进行数据收集、数据清洗和计算才能得到,适用性不高,最终还需要投入大量人力、物力资源来实现。

发明内容

针对上述现有技术中存在的问题,本发明提供一种PPT数据报告的自动生成方法,无需表格文件,而是直接采用图标与PPT关联,为数据报告的自动生成提供了一种可行的理论和实践技术保证。

为解决上述问题,本发明提供的技术方案为:

步骤(1)获取使用场景的目标原始数据记录,其中目标原始数据记录包括信息字段和文件资源字段,所述信息字段为数据源的结构化描述,所述文件资源字段为文件资源的位置信息;

步骤(2)设计数据报告模板,并将所述数据报告模板定义为通用PPT模板样式,所述通用PPT模板样式包括对应于所述信息字段的区域和对应于所述文件资源字段的区域;

步骤(3)在所述通用PPT模板样式内进行数据标记,所述数据标记用于建立所述通用 PPT模板样式与待展示的数据之间的联系;

步骤(4)设置通用PPT模板样式的参数;

步骤(5)读取所述数据报告模板,识别其数据标记并在数据库内进行自动查找,随后填充到指定的位置。

可选的,步骤(1)中所述数据源为非表格文件。

可选的,步骤(1)中所述数据源的结构化描述为利用优化算法将片段化的数据源转入多维数据表中;

其中所述优化算法如下:

其中

其中Mi为片段化的数据源对应的数据项,

其中k=1,2,3……N,N为数据源片段化的数量;

所述片段化的数据源的识别方法如下:

(1.1)片段化的数据源的背景识别:采用最佳阈值分割算法进行数据的识别,如下:

(1,2)片段化的数据源的固化识别:采用Matheron算法进行数据的精确识别,如下:

其中K

可选的,上述所述PPT数据报告的自动生成方法中,步骤(2)中所述数据标记的优化算法为基于BML标记算法与HTML标记算法混合的计算算法,具体如下:

其中

所述数据标记采用特征选择的自动扩展法,并构建近邻样本数据标记;其中采用的函数公式如下:

其中分类间隔采用

其中损失量采用dissim(i)=(x

其中s

所述待展示的数据为基于文件传输协议目录下的可扩展标记语言文件;

还包括建立解析模块、获取模块及校验模块,

其中所述解析模块对不同结构的可扩展标记语言文件进行解析,解析成匹配选中并读取的文件传输协议目录下的文件的文件格式,

其中所述获取模块用于获取经创建表结构后的不同结构的可扩展标记语言文件的定量数据;

其中所述校验模块用于根据获取的定量数据,对经创建表结构后的不同结构的可扩展标记语言文件进行准确性校验得到校验结果。

可选的,上述所述PPT数据报告的自动生成方法中,步骤(3)中所述自动查找的算法如下:

s.t.y

其中y

其中引入松弛变量ξ和从输入空间Rn到Hilbert空间Hil的变换。

可选的,上述所述PPT数据报告的自动生成方法中,步骤(4)中优化处理为调整图标的大小、位置和排布。

可选的,步骤(4)中所述自动查找的操作为根据指定的相关客户问卷中参数数据进行自动查找。

可选的,步骤(5)可并行读取多个模板文件。

可选的,该方法还包括,步骤(6)进行优化处理。

可选的,所述步骤(6)的优化处理的步骤为根据设置的格式要求并自动改变图标显示。

可选的,步骤(6)中的优化处理为调整图标的大小、位置和排布。

相比于现有技术,本发明的有益效果为:

本发明提供的自动生成方法,可通过获取的目标原始数据,其中目标原始数据记录包括信息字段和文件资源字段,根据设计的数据报告模板,从而进行内部的数据标记,建立所述通用PPT模板样式与待展示的数据之间的联系,并读取参数化的数据报告模板以完成数据的填充和优化处理,最终通过计算机程序读取分析结果,并自动生成这些数据报告,解放人力,删减中间人为参与统计步骤,专注自动分析。此外,本发明相对于已公开的现有技术,主要区别在于无需表格文件,而是直接采用图标与PPT关联。

附图说明

图1为本发明中PPT数据报告的自动生成方法的流程图;

图2为本发明中带有标记语言的通用PPT模板样式;

图3为本发明中模板文件的示意图;

图4为本发明中实际运行示例的示意图;

图5为本发明中提交分析任务的示意图;

图6为本发明中柱状类型的示意图;

图7为本发明中柱状类型的另一示意图;

图8为本发明中表格类型的示意图;

图9为本发明中表格类型的另一示意图;

图10为本发明中上传标记模板的示意图;

图11为本发明中报告输出内容参数自定义的示意图;

图12为本发明中提交报告任务的示意图;

图13为本发明中日志提醒的示意图;

图14为本发明中报告支持的示意图;

图15为本发明中报告支持的另一示意图。

具体实施方式

下面结合具体实施例和附图对本发明进一步进行描述。

目前,对于大中型集团公司而言,例如,给开发商做满意度调研,先做客户业主的数据收集,线上调查问卷(如,包含产品质量、服务体验、物业等),需要对不同层级,项目等进行多维度分析,四十家公司需准备一个PPT模板,但是分析维度有重复也有区别。

也有一些现有技术,通过Excel图表自动生成PPT文档。需要预先定义Excel的参数以及确定好PPT的基本样式和图形,并将所述报表中配置的数据与所述PPT模板中参数名的一一映射关系,这样,当用户在Excel中填充数据时,就将所述PPT模板中的图形所需要更新引用的数据从所述获取的报表中导出到所述Excel模板副本中,对PPT模板中的图形所引用的数据进行替换。

由背景技术介绍可知,这种情况下,由于需要针对不同维度调查问卷人为制作表格模板以对应不同的PPT分析需求。如,不同的开发商问卷不同,题号不同;每个报告都对应着不同的时间周期,月度报告,季度报告,年度报告;开发商的数据都存储在不同的地方。因此现有的PPT报告制作方法存在繁琐、复杂、费时、费力等问题。随着报表数量的不断增长以及数据的多样性,PPT报告人工整理制作的复杂度和耗时都呈现几何态势增加,降低了企业运维管理的效率,但增加了企业的管理运维成本。

本申请旨在通过计算机程序读取分析结果,并自动生成这些数据报告,解放人力,专注分析。

针对上述现有技术存在的诸多问题,本发明提出了一种PPT数据报告的自动生成方法。

如图1所示,本实施例的PPT数据报告的自动生成方法,包括:

步骤(1)获取使用场景的目标原始数据记录,其中目标原始数据记录包括信息字段和文件资源字段,所述信息字段为数据源的结构化描述,所述文件资源字段为文件资源的位置信息。

可选的,步骤(1)中所述数据源为非表格文件。

此外,步骤(1)中所述数据源的结构化描述为利用优化算法将片段化的数据源转入多维数据表中;

其中所述优化算法如下:

其中

其中Mi为片段化的数据源对应的数据项,

其中k=1,2,3……N,N为数据源片段化的数量;

上述优化方法可有效实现数据的降噪处理。

进一步的,所述片段化的数据源的识别方法如下:

(1.1)片段化的数据源的背景识别:采用最佳阈值分割算法进行数据的识别,如下:

(1.2)片段化的数据源的固化识别:采用Matheron算法进行数据的精确识别,如下:

其中K

上述的处理,便于数据源中的噪音与数据进行脱离,提高识别率。

该PPT数据报告的自动生成方法还包括:步骤(2)设计数据报告模板,并将所述数据报告模板定义为通用PPT模板样式(例如,客户调查问卷数据统计PPT、财务报告PPT等),所述通用PPT模板样式包括对应于所述信息字段的区域和对应于所述文件资源字段的区域。

需要提醒的是,一个通用PPT模板样式可以生成几十个文件,以便批量操作,例如,同一类型的客户组织结构,比如五十个城市公司,共用一个模板,一次输出五十个一百页的文件,达到最大效率的重用。

该PPT数据报告的自动生成方法还包括:步骤(3)在所述通用PPT模板样式内进行数据标记(在通用PPT模板样式内标记出每个位置的图表和图表需要的数据),所述数据标记用于建立所述通用PPT模板样式与待展示的数据之间的联系。

需要注意的是,标记方式并不是直接替换,而是包括了自动扩展的过程。

是否自动扩展取决于标记的定义,是由定义的规则来确定。

例如,数据库可以记录如下:

表1项目记录表

经过标记的楼盘名称n作为参数和变量可以在读取数据过程中在纵向上自动扩展。横向参数,例如,服务分、物业分、卫生分……可以根据调查问卷的参数定义标记,在读取结果的过程中自动在数据库中进行拓展,例如,交通分、小区配套分……。

因此,本发明相对于已公开的现有技术,主要区别之一在于无需Excel,而是直接采用可拓展数据库进行记录,并自定义图标与PPT关联,从而完成自动PPT生成。

该PPT数据报告的自动生成方法还包括:步骤(3)在所述通用PPT模板样式内进行数据标记,所述数据标记用于建立所述通用PPT模板样式与待展示的数据之间的联系。

上述所述PPT数据报告的自动生成方法中,所述步骤(3)中数据标记的优化算法为基于BML标记算法与HTML标记算法混合的计算算法,具体如下:

其中

上述所述PPT数据报告的自动生成方法中,所述数据标记采用特征选择的自动扩展法,并构建近邻样本数据标记;其中采用的函数公式如下:

其中分类间隔采用

其中损失量采用dissim(i)=(x

其中s

上述所述PPT数据报告的自动生成方法中,所述待展示的数据为基于文件传输协议目录下的可扩展标记语言文件;

还包括建立解析模块、获取模块及校验模块,

其中所述解析模块对不同结构的可扩展标记语言文件进行解析,解析成匹配选中并读取的文件传输协议目录下的文件的文件格式,

其中所述获取模块用于获取经创建表结构后的不同结构的可扩展标记语言文件的定量数据;

其中所述校验模块用于根据获取的定量数据,对经创建表结构后的不同结构的可扩展标记语言文件进行准确性校验得到校验结果。

此外,以上方案,可以选中并读取用于放置可扩展标记语言数据文件的文件传输协议目录下的文件,和可以对不同结构的可扩展标记语言数据文件进行解析,解析成匹配该选中并读取的文件传输协议目录下的文件的文件格式,和可以为该解析成匹配该选中并读取的文件传输协议目录下的文件的文件格式的不同结构的可扩展标记语言数据文件创建表结构,和可以获取该经创建表结构后的不同结构的可扩展标记语言数据文件的定量数据,和可以根据该获取的定量数据,对该经创建表结构后的不同结构的可扩展标记语言数据文件进行准确性校验得到校验结果,以及可以将检验结果通过准确性校验的不同结构的可扩展标记语言数据文件导入到同一文件传输协议目录下的文件中,能够实现将不同数据结构的可扩展标记语言数据文件放置到同一文件传输协议目录下的文件中。

进一步的,以上方案,可以对不同结构的可扩展标记语言文件同时或分别进行解析,解析成匹配该选中并读取的文件传输协议目录下的文件的相同或不同文件格式,这样的好处是便于将不同数据结构的可扩展标记语言数据文件放置到同一文件传输协议目录下的文件中。

此外,全新设计的标记语言,考虑如下各种情况:

A、不同客户问卷的题号不同,数据存储不同;

B、在输出xx城市公司报告的时候,输出该公司下面所属的项目,能够根据标记来过滤相应的所属项目;

C、支持不同属性的数据的输出,支持分析需要;

D、支持对应标记对应数据的自动扩展,标记为一行项目,数据输出时,根据实际项目数量增加多行;

E、同时要支持PPT中表格和图表的输出,且采用相同的标记。

标记语言示例(如表2和图2所示):

表2标记语言

其他示例:

集团A1的样本量:D:A1:T;

所有区域的满意度:D(2):A1:P-45;

佛山公司的满意度:D(3-佛山公司):A1:P-45。

该PPT数据报告的自动生成方法还包括:步骤(4)设置通用PPT模板样式的参数。

可选的,步骤(4)中所述自动查找的操作为根据指定的相关客户问卷中参数数据进行自动查找。

如图3所示,设置通用PPT模板样式的参数(指定相关客户问卷、开发商参数、时间周期等参数),读取所述数据报告模板,识别其数据标记并在数据库内进行自动查找,随后填充到指定的位置;步骤(3)中所述自动查找的算法如下:

s.t.y

其中y

其中引入松弛变量ξ和从输入空间Rn到Hilbert空间Hil的变换;

同时,需要注意的是:①查找的数据源,可以是表格,也可以是其他类型的文件;②根据指定的相关客户问卷,开发商参数,时间周期等参数,自动查找数据:

该PPT数据报告的自动生成方法还包括:步骤(5)读取所述数据报告模板,识别其数据标记并在数据库内进行自动查找,随后填充到指定的位置。

可选的,步骤(5)可并行读取多个模板文件。设置有并行执行的操作,用于读取多个模板文件,以便支持多维度,多指标的分析结果。

可选的,步骤(5)中所述自动查找的操作为根据指定的相关客户问卷中参数数据进行自动查找。

其特征在于,

步骤(5)中所述自动查找算法如下:

s.t.y

其中y

其中引入松弛变量ξ和从输入空间Rn到Hilbert空间Hil的变换。

同时,PPT数据报告生成如下:

一、分析结果

进入云途系统,提交分析任务,如图5所示。

需要提醒的是,支持多维度、多指标的并行计算,同时计算出各种分析结果;支持加权分析、排序分析、相关性分析等个性化要求;支持自定义指标表达式的算分方式。

二、报告模板打标记

类型1(表格)如图6和图7所示。

类型2(柱状图)如图8和图9所示;需要注意的是,D(1~6)代表不同的组织结构层级,如果组织结构单元有多个的情况,程序会自动扩展;支持多种排序(SORT)过滤(FILTER)等功能;标记支持多种取数类型:P-45(4、5的比例),P1(1的比例),T(样本量);支持维度/指标与属性的组合;支持PPT里的图表及表格内容输出。

三、上传报告标记模板

如图10所示,进入云途系统,找到对应的问卷,上传标记模板。

需要提醒的是,同一个问卷支持多个PPT模板。

四、报告输出内容参数自定义

如图11所示,支持个性化配置PPT里的各种参数,如:图表颜色规则,字体颜色,单元格底色等;也支持自定义对比参照切分单元,并设置输出内容格式。

五、提交报告任务

如图12所示,进入云途系统,找到对应的问卷,根据需求提交报告任务。

需要提醒的是,支持按不同层级生成数据报告,支持跑指定层级名称的数据报告,支持跑指定PPT页码的页面。

六、日志提醒

如图13所示,数据报告输出过程中会输出日志方便监控,数据报告输出过程中,支持多线程,同时输出多个PPT。

七、报告支持

如图14、15所示,支持一个模板多个PPT输出,支持各种形式的图表及表格组合。

支持小样本得分标注单元格底色、单元格字体颜色、柱状图颜色、小样本不显示得分,仅呈现为~、对比集团标注单元格底色。

该PPT数据报告的自动生成方法还包括:

步骤(6)进行优化处理。

当数据完成填充后,接着进行优化处理,直至满足设定的要求,即可。优化处理为调整图标的大小、位置和排布。具体来说,数据填充完成之后,优化,根据系统的格式要求,自动改变图表显示,表格位置、警戒颜色(如果数据采样量少于阈值,自动颜色配置,背景色配置) 等,达到优化的结果。

实际应用时,点击运行之后,可以得到批量输出的PPT文件,数量取决于同一批文件的数量。

需要提醒的是,本发明涉及的自动生成方法可涉及对应的系统(软件),如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。

本发明所提供的实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程R OM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限, RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(S DRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(S ynchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上示意性的对本发明及其实施方式进行了描述,该描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。所以,如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号