首页> 中国专利> 办公课程推荐方法、装置、电子设备及介质

办公课程推荐方法、装置、电子设备及介质

摘要

本申请提供一种办公课程推荐方法、装置、电子设备及计算机可读存储介质。其中方法包括:获取员工的多维办公数据;利用预设聚类算法对多维办公数据进行聚类,并根据聚类结果抽取出共性标签,生成员工的办公标签集合;基于Apriori算法对员工的办公标签集合进行关联规则挖掘,得到具体的强关联规则;根据强关联规则对员工进行相关办公课程推荐。相较于现有技术,通过本方案中可以得到员工自身各项办公行为数据之间准确的关联性,并在此基础上对员工进行办公课程的精确推荐,助力员工逐步提升办公效率,打造员工提效闭环。

著录项

  • 公开/公告号CN112732891A

    专利类型发明专利

  • 公开/公告日2021-04-30

    原文格式PDF

  • 申请/专利权人 平安科技(深圳)有限公司;

    申请/专利号CN202011583182.1

  • 发明设计人 纪玉娇;

    申请日2020-12-28

  • 分类号G06F16/335(20190101);G06F16/33(20190101);G06F16/35(20190101);G06Q10/10(20120101);

  • 代理机构11619 北京辰权知识产权代理有限公司;

  • 代理人刘广达

  • 地址 518048 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼

  • 入库时间 2023-06-19 10:48:02

说明书

技术领域

本申请涉及数据处理技术领域,具体涉及一种办公课程推荐方法及装置、一种电子设备以及一种计算机可读存储介质。

背景技术

公司治理一般可归结为对其所属的人事物的管理,目前大部分是基于业务数据构建可视化看板,并针对大量的业务数据进行智能分析,进而提供办公课程的相关预测或决策建议,然后员工学习建议的办公课程以提升办公效率,形成提效闭环。

但针对员工个人办公行为却缺少相关的分析,员工对自身在工作中的办公行为偏好也没有把握。员工教育背景、性格及各项行为差异使得多样化凸显,传统的基于庞大业务数据抽取共性因子的技术不再适用于个人,智能分析更加注重行为的多样化、推荐的个性化,但目前更多的是基于海量个人数据抽取共性特征,以共性特征评判个性行为的好坏,缺乏创新及理论依据,且对于员工办公课程难以提供切实可行的建议,从而难以形成提效闭环。

发明内容

本申请的目的是提供一种办公课程推荐方法及装置、一种电子设备以及一种计算机可读存储介质。

本申请第一方面提供一种办公课程推荐方法,包括:

获取员工的多维办公数据;

利用预设聚类算法对所述多维办公数据进行聚类,并根据聚类结果抽取出共性标签,生成员工的办公标签集合;

基于Apriori算法对所述员工的办公标签集合进行关联规则挖掘,得到具体的强关联规则;

根据所述强关联规则对所述员工进行相关办公课程推荐。

本申请第二方面提供一种办公课程推荐装置,包括:

获取模块,用于获取员工的多维办公数据;

标签生成模块,用于利用预设聚类算法对所述多维办公数据进行聚类,并根据聚类结果抽取出共性标签,生成员工的办公标签集合;

挖掘模块,用于基于Apriori算法对所述员工的办公标签集合进行关联规则挖掘,得到具体的强关联规则;

推荐模块,用于根据所述强关联规则对所述员工进行相关办公课程推荐。

本申请第三方面提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行以实现本申请第一方面所述的方法。

本申请第四方面提供一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现本申请第一方面所述的方法。

相较于现有技术,本申请提供的办公课程推荐方法、装置、电子设备及介质,获取员工的多维办公数据;利用预设聚类算法对多维办公数据进行聚类,并根据聚类结果抽取出共性标签,生成员工的办公标签集合;基于Apriori算法对员工的办公标签集合进行关联规则挖掘,得到具体的强关联规则;根据强关联规则对员工进行相关办公课程推荐。相较于现有技术,通过本方案中可以得到员工自身各项办公行为数据之间准确的关联性,并在此基础上对员工进行办公课程的精确推荐,助力员工逐步提升办公效率,打造员工提效闭环。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本申请的一些实施方式所提供的一种办公课程推荐方法的流程图;

图2示出了本申请的一些实施方式所提供的一种办公课程推荐装置的示意图;

图3示出了本申请的一些实施方式所提供的一种电子设备的示意图;

图4示出了本申请的一些实施方式所提供的一种计算机可读存储介质的示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本申请所属领域技术人员所理解的通常意义。

另外,术语“第一”和“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请实施例提供一种办公课程推荐方法及装置、一种电子设备以及计算机可读介质,下面结合附图进行说明。

请参考图1,其示出了本申请的一些实施方式所提供的一种办公课程推荐方法的流程图,如图所示,该办公课程推荐方法,可以包括以下步骤:

步骤S101:获取员工的多维办公数据。

其中,多维办公数据可以包括员工的基本信息、办公行为数据及办公心理数据;其中,员工的基本信息可以包括:姓名、性别、年龄、职业、联系方式、学历和籍贯等;办公行为数据(即行为特征)可以包括:会议行为数据、邮件行为数据、音视频行为数据、各项办公软件使用数据和桌面办公行为数据;办公心理数据(即心理特征)包括:各项办公行为流程是否固定、使用时间是否遵循一定规律和是否更关注效率。根据上述多维办公数据可以整理得到员工自身办公行为数据、公司整体办公行为数据及员工对各办公课程的综合喜爱程度等数据。

本步骤中,通过多种方式采集员工不同来源的办公数据,完成基础办公数据的汇总收集,也就是完成办公数据仓库搭建。

根据本申请的一些实施方式中,步骤S102之前,上述方法还包括:对收集到的员工的多维办公数据进行预处理,具体实现为:对多维办公数据进行数据清洗;对非数值化数据进行等级划分,得到非数值化数据对应的等级数值;利用均值波动替换法对数据集中的空缺值插入相应的数值。

具体的,针对员工海量的办公数据,首先进行数据清洗,然后对于非数值化数据,将其划分为不同的等级,基于不同的等级赋予相应的数据,从而完成相关非数值化指标的赋值,而针对所有数据集中可能出现的大量空缺值,利用均值波动替换法,在均值的基础上加上一个范围在-N到+N之间的数,避免插入大量相同的值对决策树的生成造成的巨大影响。

步骤S102:利用预设聚类算法对所述多维办公数据进行聚类,并根据聚类结果抽取出共性标签,生成员工的办公标签集合。

根据本申请的一些实施方式中,上述预设聚类算法包括K-means聚类算法。具体的,步骤S102可以实现为:利用K-means聚类算法指定K值对所述多维办公数据进行聚类,得到多个类。

具体实现方案如下:

针对海量的办公数据,在确定会议行为数据、邮件行为数据、音视频行为数据、各项办公软件使用数据、桌面办公行为数据等不同类别时,使用K-Means算法首先可根据对数据的先验经验选择一个合适的k值,如果没有什么先验知识,则可以通过交叉验证选择一个合适的k值。

在确定了k的个数后,我们需要选择k个初始化的质心,由于采用的是启发式方法,k个初始化的质心的位置选择对最后的聚类结果和算法运行时间都有很大的影响,因此需要选择合适的k个质心,最好这些质心不能太近。

输入是样本集D={x1,x2,...xm},聚类的簇数k,最大迭代次数N,输出是簇划分C={C1,C2,...Ck},从数据集D中随机选择k个样本作为初始的k个质心{μ1,μ2,...,μk}对于n=1,2,...,N,计算样本和各个质心向量的距离,根据距离进行分类,然后对各分类簇中所有的样本点重新计算新的质心。如果所有的k个质心向量都没有发生变化,则输出簇划分C={C1,C2,...Ck}。其中Ck代表办公数据中的一个分类。

例如,对员工大量办公数据,基于其办公数据之间的距离大小,将样本集划分为K个簇。初始数据集时让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大,假设k=3,首先随机选择3个k类所对应的类别质心,然后分别求所有办公样本数据中所有点到这3个质心的距离,并标记每个样本的类别为和该样本距离最小的质心的类别,经过计算样本数据和3个质心的距离,得到所有样本点的第一轮迭代后的类别。之后对标记为不同类别的办公数据点分别求其新的质心,即将所有点的类别标记为距离最近的质心的类别并求新的质心,最终我们得到的办公数据经过不断迭代后的3个类别。

实际应用中,使用K-means算法对数据进行聚类之后,通常需要验证评估一下聚类的效果,本实施例中利用基于熵的类评估算法进行评估每一个类的好坏,将聚类效果好的类放入聚类结果中;根据所述聚类结果中每类的聚类中心抽取出该类的共性标签作为员工的办公标签,生成员工的办公标签集合。

具体的,员工的办公标签集合的生成包括:办公数据仓库搭建完成后,需要基于海量办公数据构建数据分析模型,首先利用非监督学习算法(K-means聚类算法),从无标签数据中学习特征,将海量办公数据分成多种类别(例如会议、音视频、签报、印章、邮件、客服、桌面办公软件等),在无监督模式下,找出处于同一类数据中,大部分数据聚合的点,建立以分布的数据点最小化和邻近中心点的距离最小数据模型,某一类别下,如邮件大部分数据分布的聚合点,进而得出员工邮件的共性特征,抽取出共性标签体系,形成标签集合,也就是标签仓库,生成更加贴合业务的数据标签体系。

步骤S103:基于Apriori算法对所述员工的办公标签集合进行关联规则挖掘,得到具体的强关联规则。

具体的,步骤S103可以实现为:将所述办公标签集合中的办公标签项划分为不同的项集,采用Apriori算法确定所述项集中的频繁项集,每个频繁项集k能够产生2*(2k-1)个关联规则,筛选出其中置信度大于等于最小置信度的关联规则作为强关联规则。

具体的,将融合员工自身办公行为数据、公司整体办公行为数据及员工对各办公课程的综合喜爱程度等数据,展开数据关联分析,挖掘隐藏在数据中的相互关系。依托数据平台ADS层大量的标签数据(标签数据已经在ADS层分模块计算),对于会议、音视频、签报、印章、邮件、客服、桌面办公软件使用等办公标签项,采用Apriori算法确定其中的频繁项集;

具体的,采用Apriori算法确定频繁项集的过程如下:

假设I={I1,I2,…Im}是m个不同项目的集合,例如上述会议、音视频、签报、印章、邮件、客服、桌面办公软件使用等办公标签项的集合,集合中的元素称为项目(Item)。项目的集合I称为项目集合(Itemset),长度为k的项集称为k-项集。设任务相关的数据D是数据库事务的集合,其中每个事务T是项的集合,使得

1.支持度(suppport):是交易集中同时包含A和B的交易数与所有交易数之比。Support(A=>B)=P(A∪B)=count(A∪B)/|D|。

2.置信度(confidence):是包含A和B交易数与包含A的交易数之比。Confidence(A=>B)=P(B|A)=support(A∪B)/support(A)。

不断迭代产生新的候选集,找到支持度大于等于阈值minsup(最小支持度)的候选集,频繁项集由此产生,每个频繁k-项集能够产生2*(2k-1)个关联规则,筛选出置信度大于等于minconf(最小置信度)的关联规则作为强关联规则。

其中,最小支持度表示项集在统计意义上的最低重要性。最小置信度表示关联规则最低可靠性。如果支持度与置信度同时达到最小支持度与最小置信度,则此关联规则为强关联规则。强关联规则是指:如果规则R:X=>Y满足support(X=>Y)>=supmin(最小支持度,它用于衡量规则需要满足的最低重要性)且confidence(X=>Y)>=confmin(最小置信度,它表示关联规则需要满足的最低可靠性)称关联规则X=>Y为强关联规则,否则称关联规则X=>Y为弱关联规则。

步骤S104:根据所述强关联规则对所述员工进行相关办公课程推荐。

具体的,步骤S104可以实现为:将得到的所有强关联规则按照其置信度的大小进行排序;根据排序结果对所述员工进行相关办公课程推荐。

针对上述算法发现强关联性的办公行为,如发现在几个办公行为之间的关联性,具有这种关联性行为的此类员工均存在某些特征,便提取员工偏好的办公行为进行相关实用性课程推荐,在尽可能保障员工喜爱的前提下有效提升相关推荐课程的播放率,真正做到员工喜爱且有效,打造员工提效闭环。

举例来说,假设有如下几个强关联规则且其置信度(confidence)已给出:confidence=50%;confidence=80%;confidence=60%。

按照置信度的大小排序之后,将confidence=80%的强关联规则相关办公课程推荐给员工。

根据本申请的一些实施方式中,上述方法还可以包括以下步骤:

将上述强关联规则及根据上述强关联规则推荐的办公课程,以可视界面形式呈现给员工。例如,通过Web网页形式呈现给员工,使得员工获得更加直观的推荐结果。

基于本本申请,员工可直观的看到个人核心办公数据的变化趋势及各项办公行为时间分配情况,帮助员工更好的进行时间分配;员工可以查看自身各项办公行为数据之间的关联性,并在此过程中,发现与类似员工间的差距,及时发现存在的问题。

本申请实施例提供的办公课程推荐方法,获取员工的多维办公数据;利用预设聚类算法对多维办公数据进行聚类,并根据聚类结果抽取出共性标签,生成员工的办公标签集合;基于Apriori算法对员工的办公标签集合进行关联规则挖掘,得到具体的强关联规则;根据强关联规则对员工进行相关办公课程推荐。相较于现有技术,通过本方案中可以得到员工自身各项办公行为数据之间准确的关联性,并在此基础上对员工进行办公课程的精确推荐,助力员工逐步提升办公效率,打造员工提效闭环。

在上述的实施例中,提供了一种办公课程推荐方法,与之相对应的,本申请还提供一种办公课程推荐装置。本申请实施例提供的办公课程推荐装置可以实施上述办公课程推荐方法,该办公课程推荐装置可以通过软件、硬件或软硬结合的方式来实现。例如,该办公课程推荐装置可以包括集成的或分开的功能模块或单元来执行上述各方法中的对应步骤。请参考图2,其示出了本申请的一些实施方式所提供的一种办公课程推荐装置的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。

如图2所示,所述办公课程推荐装置10,可以包括:

获取模块101,用于获取员工的多维办公数据;

标签生成模块102,用于利用预设聚类算法对所述多维办公数据进行聚类,并根据聚类结果抽取出共性标签,生成员工的办公标签集合;

挖掘模块103,用于基于Apriori算法对所述员工的办公标签集合进行关联规则挖掘,得到具体的强关联规则;

推荐模块104,用于根据所述强关联规则对所述员工进行相关办公课程推荐。

在本申请实施例的一些实施方式中,上述装置10还包括:

预处理模块,用于在所述标签生成模块利用预设聚类算法对所述多维办公数据进行聚类之前,对所述员工的多维办公数据进行预处理。

在本申请实施例的一些实施方式中,所述预处理模块,具体用于:

对所述多维办公数据进行数据清洗;

对非数值化数据进行等级划分,得到非数值化数据对应的等级数值;

利用均值波动替换法对数据集中的空缺值插入相应的数值。

在本申请实施例的一些实施方式中,所述预设聚类算法包括K-means聚类算法。

相应的,标签生成模块102,具体用于:

利用K-means聚类算法指定K值对所述多维办公数据进行聚类,得到多个类;

利用基于熵的类评估算法进行评估每一个类的好坏,将聚类效果好的类放入聚类结果中;

根据所述聚类结果中每类的聚类中心抽取出该类的共性标签作为员工的办公标签,生成员工的办公标签集合。

在本申请实施例的一些实施方式中,挖掘模块103,具体用于:

对所述办公标签集合中的办公标签项,采用Apriori算法确定其中的频繁项集,每个频繁项集k能够产生2(2k-1)个关联规则,筛选出其中置信度大于等于最小置信度的关联规则作为强关联规则。

在本申请实施例的一些实施方式中,推荐模块104,具体用于:

将得到的所有强关联规则按照其置信度的大小进行排序;

根据排序结果对所述员工进行相关办公课程推荐。

在本申请实施例的一些实施方式中,所述多维办公数据包括基本信息、办公行为数据及办公心理数据;其中,

所述基本信息包括:姓名、性别、年龄、职业、联系方式、学历和籍贯;

所述办公行为数据包括:会议行为数据、邮件行为数据、音视频行为数据、各项办公软件使用数据和桌面办公行为数据;

所述办公心理数据包括:各项办公行为流程是否固定、使用时间是否遵循一定规律和是否更关注效率。

在本申请实施例的一些实施方式中,上述装置10还包括:

显示模块,用于将所述强关联规则及根据所述强关联规则推荐的办公课程,以可视界面形式呈现给所述员工。

本申请实施例提供的办公课程推荐装置10,与本申请前述实施例提供的办公课程推荐方法出于相同的发明构思,具有相同的有益效果。

本申请实施方式还提供一种与前述实施方式所提供的办公课程推荐方法对应的电子设备,所述电子设备可以是手机、笔记本电脑、平板电脑、台式机电脑等,以执行上述办公课程推荐方法。

请参考图3,其示出了本申请的一些实施方式所提供的一种电子设备的示意图。如图3所示,所述电子设备20包括:处理器200,存储器201,总线202和通信接口203,所述处理器200、通信接口203和存储器201通过总线202连接;所述存储器201中存储有可在所述处理器200上运行的计算机程序,所述处理器200运行所述计算机程序时执行本申请前述任一实施方式所提供的办公课程推荐方法。

其中,存储器201可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。

总线202可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中,存储器201用于存储程序,所述处理器200在接收到执行指令后,执行所述程序,前述本申请实施例任一实施方式揭示的所述办公课程推荐方法可以应用于处理器200中,或者由处理器200实现。

处理器200可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201,处理器200读取存储器201中的信息,结合其硬件完成上述方法的步骤。

本申请实施例提供的电子设备与本申请实施例提供的办公课程推荐方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。

本申请实施方式还提供一种与前述实施方式所提供的办公课程推荐方法对应的计算机可读存储介质,请参考图4,其示出的计算机可读存储介质为光盘30,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会执行前述任意实施方式所提供的办公课程推荐方法。

需要说明的是,所述计算机可读存储介质的例子还可以包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。

本申请的上述实施例提供的计算机可读存储介质与本申请实施例提供的办公课程推荐方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。

需要说明的是,附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,其均应涵盖在本申请的权利要求和说明书的范围当中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号