首页> 中国专利> 基于语义识别的可视化多维数据展示系统及方法

基于语义识别的可视化多维数据展示系统及方法

摘要

本发明涉及一种基于语义识别的可视化多维数据展示系统及方法,属于数据处理与展示技术领域,解决了现有数据处理与展示的智能化程度低、数据使用率低、响应速度慢的问题。该系统包括:语义识别模块,以多轮会话的方式获得用户的查询需求,进而确定查询指令;数据管理模块,从业务系统中获取业务数据,进行结构化处理获得不同的业务场景数据包,并存储于数据库中;查询模块,根据查询指令从数据库中提取业务数据;分析模块,根据业务数据的特性,将其转化为至少一种功能图表;操作显示模块,将提取的业务数据以及功能图表进行展示。该系统提高了数据处理与展示的智能化程度、数据的使用率及数据响应速度。

著录项

  • 公开/公告号CN112463954A

    专利类型发明专利

  • 公开/公告日2021-03-09

    原文格式PDF

  • 申请/专利权人 远光软件股份有限公司;

    申请/专利号CN202011252986.3

  • 发明设计人 陈艳霞;陈世宾;

    申请日2020-11-11

  • 分类号G06F16/34(20190101);G06F16/332(20190101);G06F40/30(20200101);

  • 代理机构11386 北京天达知识产权代理事务所(普通合伙);

  • 代理人侯永帅

  • 地址 519085 广东省珠海市科技创新海岸远光软件园

  • 入库时间 2023-06-19 10:08:35

说明书

技术领域

本发明涉及数据处理与展示技术领域,尤其涉及一种基于语义识别的可视化多维数据展示系统及方法。

背景技术

现有技术中,企业用户面对千万级、亿万级的业务数据及数百上千张的多维报表数据可视化图形展示需求,只能依赖传统的托拉拽可视化展示工具进行展示,该方法对用户的使用技能要求要求较高,提高了用户对展示工具的学习成本,并且只能根据用户的操作进行给出数据结果展示,对业务系统数据库中的数据使用率低;此外,传统的展示工具无法根据用户行为主动引导用户获取或向用户推荐有价值的数据,只能胡程度低,导致对数据的使用率低,也无法快速响应用户灵活多变的数据分析处理需求,降低了用户的使用体验。

发明内容

鉴于上述的分析,本发明旨在提供一种基于语义识别的可视化多维数据展示系统及方法,用以解决现有的数据处理与展示方法智能化程度低、对数据的使用率低且相应速度慢的问题。

一方面,本发明提供了一种基于语义识别的可视化多维数据展示系统,包括:

语义识别模块,用于基于用户的输入指令以多轮会话的方式获得用户的查询需求,并确定对应的查询指令;所述查询指令包括查询的业务场景、查询维度、查询指标、查询日期或查询条件;

数据管理模块,用于从业务系统中获取业务数据,并将所述业务数据进行结构化处理获得不同的业务场景数据包,并存储于数据库中;

查询模块,用于根据所述查询指令从所述数据库中提取对应的业务数据;

分析模块,用于根据提取的所述业务数据的特性,将所述业务数据转化为至少一种功能图表;

操作显示模块,用于将提取的业务数据以及转换获得的功能图表进行展示。

进一步的,所述数据库,还用于存储确定的所述查询指令、对应提取的业务数据及对应的功能图表;

所述查询模块用于当用户再次输入相同的查询需求时,所述语义识别模块确定对应的查询指令后,根据所述查询指令直接从所述数据库中提取对应的业务数据及功能图表。

进一步的,所述分析模块具体用于:

当提取的所述业务数据包含年度或月度时,利用趋势分析模型将提取的业务数据转化为趋势图表;

当提取的所述业务数据中的业务数据值之间的比列达到预设比例时,利用占比分析模型将提取的业务数据转化为占比图表;

当提取的所述业务数据包含奇异值时,利用离群值分析模型将提取的所述业务数据转化为离群值图表。

进一步的,所述业务场景包括组织和业务类型;

所述语义识别模块包括:

语料模块,用于对历史查询数据中涉及到的组织、对应的业务类型的标准名称分别进行统一化处理,以及对每一业务类型对应的关键字段的类型、标准名称分别进行统一化处理,获得对应的标准语料包,并存储于所述数据库中;

词条处理模块,用于将用户输入的指令进行切词获得顺序排列的多个字段信息,将所述字段信息与语料包中的组织、业务类型及关键字段进行匹配,并根据匹配结果获得对应的查询指令。

进一步的,所述语义识别模块还包括导引模块:

所述导引模块用于,所述词条处理模块无法通过匹配确定对应的查询指令时,基于所述字段信息以多轮会话的方式给出输入指令提示以引导用户补充输入指令并传输至词条管理模块,进而获得对应的查询指令;以及根据匹配结果获得多个查询指令时,将多个所述查询指令发送给用户,通过所述操作显示模块供用户选择,并将用户选择的所述查询指令传送至所述查询模块。

进一步的,所述引导模块进一步用于:

引导用户补充查询组织、查询业务类型、查询指标、查询维度、查询日期或查询条件,进而获得对应的查询指令。

进一步的,所述导引模块,还用于根据用户的历史查询记录给出查询指令提示,通过所述操作显示模块供用户选择,并将用户选择的所述查询指令传送至所述查询模块。

进一步的,所述数据管理模块,将所述业务数据进行结构化处理获得不同的业务场景语料包,包括:

确定每一业务场景下每一业务数据对应的维度信息、指标信息及日期信息的标准名称;

对每一业务数据对应的所述维度信息、指标信息及日期信息进行统一化处理,获得不同的业务场景数据包,并存储于数据库中

进一步的,所述词条处理模块进一步用于:

将每一所述字段信息分别与所述语料包中的组织和业务类型进行匹配,确定所述组织和业务类型的标准名称,从而获得查询指令中的业务场景;

在确定的所述业务场景对应的关键字段中,根据所述关键字段的类别和标准名称确定所述字段信息的标准名称,从而获得查询指令中的查询维度、查询指标及查询日期;

基于获得的标准名称对顺序排列的字段信息进行标注,替换对应的字段信息,从而获得查询指令。

另一方面,本发明提供了一种基于语义识别的可视化多维数据展示方法,包括:

基于用户的输入指令以多轮会话的方式获得用户的查询需求,并确定对应的查询指令;所述查询指令包括查询的业务场景、查询维度、查询指标、查询日期或查询条件;

从业务系统中获取业务数据,并将所述业务数据进行结构化处理获得不同的业务场景数据包,并存储于数据库中;

根据所述查询指令从所述数据库中提取对应的业务数据;

根据提取的所述业务数据的特性,将所述业务数据转化为至少一种功能图表;

通过显示器将提取的业务数据以及转换获得的功能图表进行展示。

与现有技术相比,本发明至少可实现如下有益效果之一:

1、本发明提出的基于语义识别的可视化多维数据展示系统及方法,以多轮会话的方式获得用户的查询意图,以确定相应的查询指令;此外,根据用户的历史查询记录可以向用户提供相应的输入指令或查询指令提示,以供用户选择,或者根据用户的历史查询记录直接向用户展示相应的数据和图表提高了人机交互的人性化,并提高了数据查询的响应速率;

2、本发明可以根据企业的业务特点构建场景化的数据分析模型,该分析模型可以根据获得的业务数据的特性对业务数据进行分析并转化为相应的图表,免去人工学习、计算、图表制作等步骤,使数据展示多样化,具体的,根据数据特征,提供基于内容推荐及协同过滤等算法服务来实现主动式关联分析推荐,可为不同业务、不同需求的用户提供多种类多维度的数据分析图表,呈现方式精确科学,为数据信息的汇报、传达提供支持,提高了数据处理与分析和智能化程度和数据使用率;此外,该分析模型不受客户端和展示终端的限制,为数据的集中管理提供便利,节省数据处理的时间,提升数据可视化展示效率。

本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。

附图说明

附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。

图1为本发明实施例基于语义识别的可视化多维数据展示系统的示意图;

图2为本发明实施例对业务数据进行结构化处理结果的示意图;

图3为本发明实施例用户查询的其他运营费用对应的业务数据的示意图;

图4为本发明实施例分析模块根据图3所示的业务数据给出相应图表的示意图;

图5为本发明实施例导引模块以多轮会话的方式给出输入指令提示的示意图;

图6为本发明实施例基于语义识别的可视化多维数据展示方法的示意图。

具体实施方式

下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。

本发明的一个具体实施例,公开了一种基于语义识别的可视化多维数据展示系统。如图1所示,该系统包括:

语义识别模块,用于基于用户的输入指令以多轮会话的方式获得用户的查询需求,并确定对应的查询指令。其中,用户可以通过手动或者语音输入指令,多轮会话的方式可以将用户多轮会话的输入作为一个整体用于确定查询指令。具体的,查询指令包括查询的业务场景、查询维度、查询指标、查询日期或查询条件。业务场景包括组织和业务类型。示例性的,业务场景可以是公司A的其他运营费用分析场景或者公司B的营销活动用户类别分析场景等;具体的,公司A、公司B为组织,其他运营费用分析场景和营销活动用户类别分析场景为业务类型,其中,其他运营费用分析场景包括业务活动维度和一系列成本要素指标,如办公费、差旅费、咨询费等;营销活动用户类别分析场景包括业务活动维度、用户类别维度,以及一系列营销活动指标如用户数量、售电量、营销成本等。

优选的,多轮会话方式对应的策略包括:超过时间清除历史状态记忆、超过轮询次数清除历史状态记忆和永久保存策略等。历史状态主要记录保存词槽中的词槽值,词槽是用于用户会话中关键词词条进行填写的槽。

数据管理模块,用于从业务系统中获取业务数据,并将业务数据进行结构化处理获得不同的业务场景数据包,并存储于数据库中。业务系统指的是不同企业的业务系统或者企业中不同领域对应的业务系统。如图2所示,具体的,对业务数据进行结构化处理是指对业务数据的场景、维度、指标及日期等进行统一化处理(或规范)。示例性的,将业务系统中的数据装载到本系统中,按照统一规范对数据进行处理,包括同义词转化、数据完整行校验等。

查询模块,用于根据查询指令从数据库中提取对应的业务数据。

分析模块,基于机器学习、智能算法及NLP技术等,主动探索业务数据的潜在规律,挖掘该场景下各种维度、指标组合的异常偏离值、空值、最大值、最小值、平均值、梯度等,定位数据集中的异常业务数据信息。优选的,可以根据提取的业务数据的特性,将业务数据转化为至少一种功能图表。具体的,可以根据不同企业的业务特性,设置不同的分析模型。

操作显示模块,用于将提取的业务数据以及转换获得的功能图表进行展示。优选的,操作显示模块可以是实现人机交互的PC端或者手机端。

优选的,数据库,还用于存储确定的查询指令、对应提取的业务数据及对应的功能图表。

当用户再次输入相同的查询需求时,语义识别模块确定对应的查询指令后,查询模块,能够根据查询指令直接从数据库中提取对应的业务数据及功能图表,直接通过操作展示模块进行展示,以提高数据处理与展示的响应速度,提升用户体验。

优选的,分析模块可以包括趋势分析模型、占比分析模型以及离群值分析模型。

具体的,提取的业务数据包含年度或月度时,即存在所查询的数据随时间变化时,相应的趋势分析模型可以将提取的业务数据转化为趋势图表,以供用户参考。

当提取的所述业务数据中的业务数据值之间的比列达到预设比例时,利用占比分析模型将提取的业务数据转化为占比图表,以供用户参考。优选的,该预设比例可以根据使用需求进行自定义设置。示例性的,某企业2020年一月份的总费用为150万,而其中人员动因类费用为90万,占比达到50%以上,则显而易见,人员动因类费用与其他项费用间的差值显著,占比分析模型则将对应的业务数据转化为占比图表,用户通过该图表可以更加直观的确定主导占比数据项。

当提取的业务数据包含奇异值时,相应的离群值分析模型可以将提取的业务数据转化为离群值图表。示例性的,企业营业规模动因类费用中只有用电营业有对应的费用数值,其他项(如企业管理、供电服务、变电检修、智能用电等)的费用数值均为0,则表明用电营业的费用数据可能存在异常,离群值分析模型将其转化为离群值图表,以供用户参考,提醒用户数据可能存在异常。

优选的,当提取的业务数据具有以上多个特性时,则分析模块相应的将业务数据转化为多个图表。示例性的,用户查询一月份的其他运营费用时,获得的业务数据如图3所示,其中还包括含了二月和三月的其他运用费用相应维度及相应指标的数据,由于篇幅较大,图3中只显示了部分业务数据;分析模块可以分析查询到的业务数据的特性,进而转换为相应的图表,如图4所示。提高了本系统智能化程度的同时,减轻了人力进行制表绘图的工作。具体的,图3中包含其他运用费用各项随月份的变化,因此趋势分析模型根据该特性将业务数据转化为对应的趋势图表;其中人员动因类费用相比于其他费用的差值较大,因此占比分析模型可以根据该特性将业务数据转化为对应的占比图表;此外,政策动因类费用在三个月份的数值相对平均,因此低方差分析模型可以根据该特性将业务数据转化为平均图表;营业规模动因类维度对应几个指标中,只有用电营业指标具有数值且远大于其他指标的值,此时利用离群值分析模型可以根据该特性将业务数据转为离群值图表。

优选的,分析模块通过下述方式将提取的业务数据转换为对应的图表:

根据查询维度、查询条件及展示方式(升序或降序)确定图表的展示维度;根据查询维度、查询指标、查询条件及展示方式确定图表的展示度量,展示方式取可视化方式,优选的,可以包括卡片、列表、柱形图、条形图、折线图、饼状图、环形图、散点图、树图等。优选的,预置分析模型多个默认展示方式的优先级,若可视化方式为空或者与分析模型展示维度度量个数冲突时,判断展示维度个数,若判断有0个展示维度,1个展示度量默认卡片,大于等于1个展示维度或度量值大于2默认列表,其中维度为时间时默认转化为折线图。

优选的,语义识别模块包括:

语料模块,用于对历史查询数据中涉及到的组织、对应的业务类型的标准名称分别进行统一化处理,以及对每一业务类型对应的关键字段的类型、标准名称分别进行统一化处理,获得对应的标准语料包,并存储于数据库中。示例性的,公司A的名称可能有多种,公司A中某一部分的名称也可能有多种,将多种名称统一化为一个标准名称,对应的业务类型也做相同的处理。具体的,每一业务类型包括的关键字段的类型有时间、维度或指标等。示例性的,去年、今年、本月、这个月、上个月对应的关键字段的类型都为时间,本月、当月、这个月都统一化成标准名称“本月”;办公费、差旅费、住宿费、交通费及餐饮费对应的关键字段的类型都为指标,差旅费、住宿费、交通费及餐饮费都统一化为标准名称“差旅费”。

词条处理模块,用于将用户输入的指令进行切词获得顺序排列的多个字段信息,将字段信息与语料包中的组织、业务类型及关键字段进行匹配,并根据匹配结果获得对应的查询指令。

具体的,将每一字段信息分别与语料包中的组织和业务类型进行匹配,确定组织和业务类型的标准名称,从而获得查询指令中的业务场景。具体的,当用户查询本公司或本企业内的相关数据时,无需确定对应的组织标准名称,此外,可以根据某些字段信息的具体特征确定对应的业务类型。

在确定的业务场景对应的关键字段中,根据关键字段的类别和标准名称确定字段信息的标准名称,从而获得查询指令中的查询维度、查询指标及查询日期。

基于获得的标准名称对顺序排列的字段信息进行标注,替换对应的字段信息,从而获得查询指令。

示例性的,用户输入指令:我要查这个月办公费大于10并且差旅费小于100的业务活动并按办公费降序。根据该指令获得查询指令的具体过程如下:

步骤1、将输入指令进行且此获得顺序排列的多个字段信息:这个月、办公费、大于10、差旅费、小于100、业务活动、办公费、降序。

步骤2、根据差旅费和办公费确定对应的业务类型为其他运营费用多维分析。

步骤3、根据字段信息业务活动确定查询维度为业务活动。

步骤4、根据字段信息差旅费和办公费确定的查询指标为差旅费和办公费。

步骤5、根据字段信息这个月确定的查询时间为本月,本月即用户查询时的月份。

步骤6、根据字段信息办公费、大于10、差旅费、小于100确定的查询条件为办公费大于10且差旅费小于100。

步骤7、根据字段信息办公费、降序确定查询的数据展示形式为以办公费降序排序展示。

步骤8、对字段信息进行文本标注从而获得对应的查询指令:

我要查<查询时间>这个月<查询指标>办公费<查询条件>大于<值>10并且<查询指标>差旅费<查询条件>小于<值>100的<查询维度>业务活动并按<查询指标>办公费<展示形式>降序。

优选的,语义识别模块还包括导引模块:

词条处理模块无法通过匹配确定对应的查询指令时,如图5所示,导引模块,用于基于字段信息以多轮会话的方式给出输入指令提示以引导用户补充输入指令并传输至词条管理模块,进而获得对应的查询指令。

此外,词条处理模块根据匹配结果获得多个查询指令时,导引模块,可以将多个查询指令发送给用户,通过操作显示模块供用户选择,并将用户选择的查询指令传送至查询模块。

优选的,引导模块以多轮会话的方式给出输入指令提示,包括:

引导用户补充查询组织、查询业务类型、查询指标、查询维度、查询日期或查询条件,进而获得对应的查询指令。

优选的,导引模块,基于用户的历史查询记录进行机器学习,因此当用户输入指令不完整时,可以根据用户的历史查询记录给出查询指令提示,通过操作显示模块供用户选择,并将用户选择的所述查询指令传送至查询模块,以及向用户推荐与该查询指令相关联的其他查询指令,以为用户提供数据查询参考,提高数据的使用效率。

优选的,数据管理模块,将业务数据进行结构化处理获得不同的业务场景语料包,包括:

确定每一业务场景下每一业务数据对应的维度信息、指标信息及日期信息的标准名称。

对每一业务数据对应的维度信息、指标信息及日期信息进行统一化处理,获得不同的业务场景数据包,并存储于数据库中。

本发明的另一个实施例,公开了一种基于语义识别的可视化多维数据展示方法。

由于该方法实施例与上述系统实施例的原理相同,因此详细之处可以参考系统实施例,在此不再赘述。

如图6所示,该方法包括以下步骤:

基于用户的输入指令以多轮会话的方式获得用户的查询需求,并确定对应的查询指令;所述查询指令包括查询的业务场景、查询维度、查询指标、查询日期或查询条件。

从业务系统中获取业务数据,并将业务数据进行结构化处理获得不同的业务场景数据包,并存储于数据库中。

根据查询指令从数据库中提取对应的业务数据。

根据提取的业务数据的特性,将业务数据转化为至少一种功能图表。

通过显示器将提取的业务数据以及转换获得的功能图表进行展示。

与现有技术相比,本发明提出的基于语义识别的可视化多维数据展示系统及方法,一方面,以多轮会话的方式获得用户的查询意图,以确定相应的查询指令;此外,根据用户的历史查询记录可以向用户提供相应的输入指令或查询指令提示,以供用户选择,或者根据用户的历史查询记录直接向用户展示相应的数据和图表提高了人机交互的人性化,并提高了数据查询的响应速率;另一方面,本发明可以根据企业的业务特点构建场景化的数据分析模型,该分析模型可以根据获得的业务数据的特性对业务数据进行分析并转化为相应的图表,免去人工学习、计算、图表制作等步骤,使数据展示多样化,具体的,根据数据特征,提供基于内容推荐及协同过滤等算法服务来实现主动式关联分析推荐,可为不同业务、不同需求的用户提供多种类多维度的数据分析图表,呈现方式精确科学,为数据信息的汇报、传达提供支持,提高了数据处理与分析和智能化程度和数据使用率;此外,该分析模型不受客户端和展示终端的限制,为数据的集中管理提供便利,节省数据处理的时间,提升数据可视化展示效率。

本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号