公开/公告号CN106059831A
专利类型发明专利
公开/公告日2016-10-26
原文格式PDF
申请/专利权人 苏州迈科网络安全技术股份有限公司;
申请/专利号CN201610591034.1
申请日2016-07-26
分类号H04L12/24;H04L29/08;G06F17/30;G06Q10/06;
代理机构南京苏科专利代理有限责任公司;
代理人陆明耀
地址 215021 江苏省苏州市工业园区林泉街399号东南大学明德院3楼
入库时间 2023-06-19 00:46:44
法律状态公告日
法律状态信息
法律状态
2023-04-11
专利权人的姓名或者名称、地址的变更 IPC(主分类):H04L12/24 专利号:ZL2016105910341 变更事项:专利权人 变更前:苏州迈科网络安全技术股份有限公司 变更后:苏州迈科网络安全技术股份有限公司 变更事项:地址 变更前:215021 江苏省苏州市工业园区林泉街399号东南大学明德院3楼 变更后:215133 江苏省苏州市相城区高铁新城南天成路88号天成信息大厦3楼301-302室
专利权人的姓名或者名称、地址的变更
2019-08-09
授权
授权
2016-11-23
实质审查的生效 IPC(主分类):H04L12/24 申请日:20160726
实质审查的生效
2016-10-26
公开
公开
技术领域
本发明涉及企业运行管理状况的方法及系统,尤其涉及一种基于互联网访问情况分析企业运行管理状况的方法及系统。
背景技术
企业经营过程中,企业管理者需及时了解知道员工的工作动向、情绪变化、工作负荷等相关背景信息,另外,节能减排的有效推进不仅能让企业节约开支,更是企业社会责任的重要体现。
传统方法中,这些信息主要通过问卷调查,面对面沟通等方式进行,这些方式虽然具有内容详细、针对性强等优势,但存在周期长、效率低、信息不及时、主观性较强、信息不真实等问题。
并且,随着时代的变化,新一代年轻人的自我意识和被尊重意识更显强烈,对企业管理措施从堵到疏的要求日益迫切
因此,就企业经营管理而言,特别是在人的管理上,企业经营的管理者需要有更多的渠道及时反映员工的情绪变化、员工的敬业程度等真实信息。
网络设备在互联网不同的阶段有不同的角色产生,满足不同层次的需求,同样也可以用马斯洛需求层次理论(生理需求、安全需求、社交需求、尊重需求和自我实现需求)分析。
随着互联网的进一步发展,为满足社会人对尊重的需求,相关网络设备出现就成为必然。
发明内容
本发明的目的就是为了解决现有技术中存在的上述问题,创新的使用“互联网+企业管理”的理念,通过对企业内部有效主机互联网访问行为数据的挖掘分析,从而提供了一种能够为企业节能减排和员工关怀方面实时地提供信息支撑的基于互联网访问情况分析企业运行管理状况的方法及系统。
本发明的目的将通过以下技术方案得以实现:
基于互联网访问情况分析企业运行管理状况的方法,包括如下步骤:
S1,获取企业互联网出口处设备采集的网络访问DPI信息、DFI信息以及企业的基础数据,形成数据源;
S2,对数据源中的数据进行处理,建立节能提示模型,并通过节能提示模型查找企业中是否存在长期开机且非服务器的主机,并在识别出长期开机且非服务器的主机时,发出预警;
S3,对数据源中的数据进行处理,建立员工互联网偏好模型,通过员工互联网偏好模型进行员工访问网络的时间段偏好分析、员工访问网络的应用偏好分析以及员工访问网络的URL类型偏好分析;
S4,对数据源中的数据进行处理,建立员工情绪模型,通过员工情绪模型进行员工访问招聘类网站的时间段分析、员工访问招聘类网站的频度分析;
S5,对数据源中的数据进行处理,建立员工工作负荷模型,通过员工工作负荷模型进行员工工作时间的分析和员工访问工作相关网站时间段分析;
S6,将S2-S5的分析结果进行展示。
优选的,所述基础数据包括预定义基础数据、配置基础数据。
优选的,所述S2步骤-S5步骤中对数据源中的数据进行处理的过程包括数据清洗、数据关联、数据聚合、信息提取、信息验证及信息评估预测。
优选的,所述S2步骤包括如下过程:
S21,按照gw_id,equip_id,user_id,user_name,time_date,URL,time_distinct对数据源中的数据表进行汇总操作,获取数据子集;
S22,按照gw_id,time_date,equip_id对S21步骤得到的数据子集进行汇总得到数据表;
S23,按照gw_id,time_date对S22步骤得到的数据表做汇总,取size()作为汇总统计量,该汇总统计量即为当日有效主机数;
S24,对S22步骤得到的数据表,按照gw_id,equip_id进行分组,观测每个time_date时间窗口内,有效主机是否一直有URL访问行为,将此类主机定义为未关机主机,并在数据表中增加status列,标示为未关机状态,得到新的数据表;
S25,对S24步骤中新的数据表使用公式:非工作特征时间URL数≤1/3*工作特征时间URL数,并在数据表中增加无人操作标识维度(no_operation),标记no_operation=yes(无人操作标识),得到新的数据表;
S26,对S25步骤得到的数据表按照gw_id,time_date,status,no_operation进行汇总,取size()作为汇总统计量,其中,status=no_power_off(未关机标识)并且no_operation=yes(无人操作标识)的值即为未关机数(当日未关机且无人操作的主机数),得到新的数据表;
S27,对S26步骤得到的数据表使用公式:
未关机比例=非工作时段无人操作主机总数/当日有效主机总数;
S28,将日期(time_date)、未关机数、未关机比例连接,形成企业未关机趋势,超过预定阀值触发报警;
S29,将无人操作主机ID与日期(time_date)连接,得到最近一个月内1天、3天、1周、半月个以及一个月连续未关机的主机数刻画,超过预定阀值触发报警。
优选的,所述企业未关机趋势通过时间曲线图表示,所述S210步骤的分析结果通过帕累托图表示。
优选的,所述S3步骤包括如下过程:
S31,在数据源中提取最近一周或一月的URL数据表;
S32,对S31步骤中的URL数据表按照gw_id,URL做汇总,取sum(hit_num)作为汇总统计量,将此点击量的汇总统计量作为最近一周或一月的URL网站访问热度指标;
S33,在数据源中提取最近一周或一月的流量数据表;
S34,在S33步骤中的流量数据表中增加traffic字段,使用公式:
traffic=traffic_up+traffic_down,得到新的数据表;
S35,对S34步骤中得到的数据表按照gw_id,app_name做汇总计算,取sum(traffic)作为汇总统计量,将此流量的汇总统计量作为最近一周或一月的app使用热度指标。
优选的,所述S4步骤包括如下过程:
S41,在数据源中提取最近一周或一月的URL数据表,其中URL_type=33619968(招聘类);
S42,对S41步骤中的数据表按照gw_id,time_dim进行汇总,汇总统计量取sum(hit_num);
S43,对S42步骤中点击量总数按倒序排序,即为最近一周或一月的各时段访问招聘网站的热度排名结果;
S44,对S41步骤中的URL数据表按照gw_id,time_dim,user_id,user_name进行汇总,得到新的数据表;
S45,对S44步骤中得到的数据表按照gw_id,time_dim汇总,取size()作为汇总统计量,该统计量即为不同员工在该时段访问招聘网站的次数。
优选的,所述S5步骤包括如下过程:
S51,在数据源中提取URL数据表;
S52,在S51步骤的URL数据表中进一步提取可识别URL(URL_type不等于NULL)形成数据表;
S53,对S52步骤形成的数据表按照gw_id,user_id,user_name,time_dim,URL_type进行汇总,取size()作为汇总统计量;
S54,将URL_type=“生产类”的网站有点击行为的用户定义为工作状态,在S52步骤形成的数据表中添加新字段work_status信息,将生产类网站有点击行为定义为工作状态;
S55,对S54步骤得到的数据表中的表状态work_status赋值,当同一个用户处于工作状态时,其状态只要不连续出现非工作状态,则将偶现的非工作状态修正为工作状态;
S56,汇总计算S55步骤得到的数据表中time_dim的开始时段(上班开始时段)、结束时段(下班开始时段)、中间时段(工作时长);
S57,对S54步骤得到的数据表进行汇总计算,汇总统计量按time_date取sum(hit_num),即获得生产类URL的日点击总数,再按日期排序即可得到生产类网站的访问趋势。
优选的,来自于数据源中提取的数据子集,并进行了数据类型转换,用于为建模做准备的中间数据表结构包括:网关ID号,时间槽,用户名,终端类型号,网址分组号,hit次数。
基于互联网访问情况分析企业运行管理状况的系统,包括:
数据获取单元,用于获取企业互联网出口处设备采集的网络访问DPI信息、DFI信息以及企业的基础数据,形成数据源;
节能提示单元,用于对数据源中的数据进行处理,建立节能提示模型,并通过节能提示模型查找企业中是否存在长期开机且非服务器的主机,并在识别出长期开机且非服务器的主机时,发出预警;
员工互联网偏好分析单元,用于建立员工互联网偏好模型,通过员工互联网偏好模型进行员工访问网络的时间段偏好分析、员工访问网络的应用偏好分析以及员工访问网络的URL类型偏好分析;
员工情绪分析单元,用于对数据源中的数据进行处理,建立员工情绪模型,通过员工情绪模型进行员工访问招聘类网站的时间段分析、员工访问招聘类网站的频度分析;
员工工作负荷分析单元,用于对数据源中的数据进行处理,建立员工工作负荷模型,通过员工工作负荷模型进行员工工作时间的分析和员工访问工作相关网站时间段分析;
以及,展示单元,用于将节能提示单元、员工互联网偏好分析单元、员工情绪分析单元以及员工工作负荷分析单元的分析结果进行展示。
本发明技术方案的优点主要体现在:
本发明通过对互联网访问的跟踪记录和分析建模,可以对公司内部员工的工作动向、情绪变化、工作负荷、节能等情况进行分析,便于企业经营者及时了解员工的动态,为企业经营管理者的管理行为提供了有效的数据支撑,从而为企业经营者可以及时安抚员工情绪,对可能存在的问题防患于未然;同时也可以通过制定针对性的措施,提高团队的士气和凝聚力。
本方法数据获取及时、准确、快速,受人为主观因素影响小,数据分析效率高、范围广。
具体实施方式
本发明的目的、优点和特点,将通过下面优选实施例的非限制性说明进行图示和解释。这些实施例仅是应用本发明技术方案的典型范例,凡采取等同替换或者等效变换而形成的技术方案,均落在本发明要求保护的范围之内。
本发明重点关注企业内部管理和员工关怀两个方面,其中,企业内部管理至少包括节能提示模型;员工关怀方面至少包括员工互联网偏好分析、员工情绪分析和员工工作负荷度分析三个主体模型,结合企业基础数据,在员工个体和员工群体两个尺度上反映员工的各个方面。
具体的,本发明揭示的基于互联网访问情况分析企业运行管理状况的系统,包括:数据获取单元、节能提示单元、员工互联网偏好分析单元、员工情绪分析单元、员工工作负荷度分析单元以及结果展示单元。
其中,所述数据获取单元,用于获取企业互联网出口处设备采集的网络访问DPI信息、DFI信息以及企业的基础数据,形成数据源,其中,所述基础数据至少包括预定义基础数据、配置基础数据。
所述节能提示单元,用于对数据源中的数据进行处理,建立节能提示模型,并通过节能提示模型查找企业中是否存在长期开机且非服务器的主机,具体通过设备类型字段判断是否是服务器,并将下班特征时段有URL访问行为判定为未关机,进一步通过有无生产类访问行为判断是否为无人操作的主机,并将复核上述三个条件的主机进行标记,连续数天被标记为未关机且无人操作的主机即是长期未关机主机,在识别出长期未关机且非服务器的主机时,发出预警。
具体的,所述节能提示模型从时间维度和设备开机类型维度两个角度建立,时间上,所述节能提示模型监测活跃设备,所述活跃设备指当日开机的有效主机,包括PC、移动终端、路由或交换、其他终端等,计算每天的下班时间无人操作且未关机主机数,按日期形成未关机比例和未关机数的变化趋势,并以时间曲线图表示(active_dis)。
设备开机类型上,节能提示模型监测被标记为未关机无人操作主机的未关机持续数天,将未关机主机分别统计为1天未关机、3天未关机、一周未关机、15天未关机、一个月未关机,并用帕累托图表示(active_user)。
并且,所述节能提示模型提取如下数据结构:
网关id:gw_id;
设备ID:equip_id;
设备类型:equip_type;
用户ID:user_id;
用户名:user_name;
IP地址:ip;
MAC地址:mac;
时间戳:time_int;
URL:URL;
点击数目:hit_num;
时间:time_date;
时间特征:time_distinct。
所述员工互联网偏好分析单元,用于对员工在上班时段、加班时段以及其他时段关心的内容进行分析,以供管理者了解相关情况,其具体通过对数据源中的数据进行处理,建立员工互联网偏好模型,并通过员工互联网偏好模型进行员工访问网络的时间段偏好分析、员工访问网络的应用偏好分析以及员工访问网络的URL类型偏好分析。
其中,员工访问网络的时间段偏好分析主要是将每天分为48个时段(每段半小时),根据最近一个月(不满一个月,取全量)或最近一周(不满一周,取全量)的数据,按照每个时间段的URL量确定哪个时段访问量最高,即汇总计算哪个时段的URL点击数最多,即时段偏好,其分析结果是网站访问热度对应的时段的帕累托图。
员工最喜爱访问的应用组排名(员工访问网络的应用偏好分析)主要是按照最近一个月(不满一个月,取全量)或最近一周(不满一周,取全量)的数据,获取每个应用组的访问量数据,将应用组分类排名,默认取Top10(可根据需要自由选择),其可以使用app应用产生的流量大小来度量(app使用热度指标),其分析结果是应用流量数据对应的应用名称的帕累托图。
所述员工访问网络的URL类型偏好分析主要是将访问记录关联URL分类信息(将URL划分为分为门户、工具、科技、频网、媒体营销、教育学习等29个细分门类),通过过滤(去掉机器自发的URL行为)、汇总(在同一个网关内按URL名称汇总,取点击数之和作为汇总统计量)、排序,给出员工最喜爱访问网站的URL类型排名,其可以按照URL类型分别汇总统计URL点击数得到,其分析结果是URL类型点击数对应每个URL类型的帕累托图。
并且,所述员工互联网偏好模型提取如下数据结构:
URL数据表:
网关ID:gw_id
用户ID:user_id
用户名:user_name
时间戳:time_int
时间:time_format
URL:URL
URL类型:URL_type
点击次数:hit_num
时间维度:time_dim
人员维度:person_dim
流量数据表:
网关ID:gw_id
用户ID:user_id
用户名:user_name
时间戳:time_int
时间:time_format
APP ID:app_id
APP:app_name
APP类型:app_type
上行流量:traffic_up
下行流量:traffic_down
点击次数:hit_num
时间维度:time_dim
人员维度:person_dim。
进一步,所述员工情绪分析单元考察员工主动访问互联网查找招聘类信息的分布状况,招聘类网站访问的时间分布,人员分布,访问密度分布等信息,通过招聘类网站的访问来判断员工是否是寻求其他工作机会,基于假设:如果某个非HR员工经常访问招聘类网站,则说明该员工有跳槽打算,若企业内很多员工同时在找工作,则说员工情绪普遍低落,而员工访问招聘类网站的频度越高说明人数越多,情绪越差,通过招聘类网站的访问时段、访问频度分析,有助于管理者采取相应的措施,为管理者策略制定提供信息支撑。
详细的,所述员工情绪分析单元通过对数据源中的数据进行处理,建立员工情绪模型,并通过员工情绪模型进行员工访问招聘类网站的时间段分析、员工访问招聘类网站的频度分析,其中员工访问招聘类网站的访问时段分析即将每天分为48个时段(每段半小时),分析最近一段时间(1周或1个月)内,招聘类网站在哪个时段的点击数最多,点击数最多的时段即员工访问招聘类网站的偏好时段;员工访问招聘类网站的频度分析主要是计算哪个时段访问招聘类网站的人数最多以及统计每个员工在一段时间内访问招聘类网站的次数。
所述员工情绪模型模型提取如下数据结构:
网关ID:gw_id;
用户ID:user_id;
用户名:user_name;
时间戳:time_int;
时间:time_format;
URL:URL;
URL类型:URL_type
点击次数:hit_num
时间维度:time_dim;
人员维度:person_dim。
更进一步,所述员工工作负荷度分析单元考察员工工作时间的分布,员工访问工作类网站的时间分布等信息,起通过对数据源中的数据进行处理,建立员工工作负荷模型,并通过员工工作负荷模型进行员工工作时间的分析和员工访问工作相关网站时间段分析,主要是使用是否有生产类URL的访问来判断是否为上班状态,对状态进行连续化处理后即可得到员工总做时间的分布;进一步按照上班时段对生产类网站汇总统计即可得到生产类网站的时段偏好,其最终的分析结果即上下班时间分布,上班时长分布,上班时段生产类网站的访问时段偏好。
所述结果展示单元,用于将节能提示单元、员工互联网偏好分析单元、员工情绪分析单元以及员工工作负荷度分析单元的分析结果进行展示,起展示的方式主要是通过基于云端的服务器,以网页形式展示。
再进一步,所述节能提示单元、员工互联网偏好分析单元、员工情绪分析单元以及员工工作负荷度分析单元对数据源中的数据进行处理的过程至少包括数据清洗、数据关联、数据聚合、信息提取、信息验证及信息评估预测。
并且,中间数据表是介于原始数据和结果数据之间,是数据分析处理过程中的重要环节,其是来自于数据源中提取的数据子集,并结合了基础的ID编码等信息,用于为某个数据模型建立做准备的数据表,所述中间数据表结构如下:网关ID号,时间槽,用户名,终端类型号,网址分组号,hit次数。
同时,本发明揭示的基于互联网访问情况分析企业运行管理状况的方法,包括如下步骤:
S1,获取企业互联网出口处设备采集的网络访问DPI信息、DFI信息以及企业的基础数据,形成数据源;
S2,对数据源中的数据进行处理,建立节能提示模型,并通过节能提示模型查找企业中是否存在长期开机且非服务器的主机,并在识别出长期开机且非服务器的主机时,发出预警。
其建模及分析的具体过程如下:
S21,按照gw_id,equip_id,user_id,user_name,time_date,URL,time_distinct对数据源中的数据表进行汇总操作,获取数据子集;
S22,按照gw_id,time_date,equip_id对S21步骤得到的数据子集进行汇总得到数据表;
S23,按照gw_id,time_date对S22步骤得到的数据表做汇总,取size()作为汇总统计量,该汇总统计量即为当日有效主机数;
S24,对S22步骤得到的数据表,按照gw_id,equip_id进行分组,观测每个time_date时间窗口内,有效主机是否一直有URL访问行为,将此类一直有URL访问行为的主机定义为未关机主机,并在数据表中增加status列,标示为未关机状态,得到新的数据表;
S25,对S24步骤中新的数据表使用公式:非工作特征时间URL数≤1/3*工作特征时间URL数,并在数据表中增加无人操作标识维度(no_operation),标记no_operation=yes(无人操作标识),得到新的数据表;
S26,对S25步骤得到的数据表按照gw_id,time_date,status,no_operation进行汇总,取size()作为汇总统计量,其中,status=no_power_off(未关机标识)并且no_operation=yes(无人操作标识)的值即为未关机数(当日未关机且无人操作的主机数),得到新的数据表;
S27,对S26步骤得到的数据表使用公式:
未关机比例=非工作时段无人操作主机总数/当日有效主机总数;
S28,将日期(time_date)、未关机数、未关机比例连接,形成企业未关机趋势,超过预定阀值触发报警;所述预定阀值由用户指定,所述未关机比例默认为10%
S29,将无人操作主机ID与日期(time_date)连接,得到最近一个月内1天、3天、1周、半月个以及一个月连续未关机的主机数刻画,超过预定阀值触发报警。所述预定阀值由用户指定,默认持续未关机天数为3天。
S3,对数据源中的数据进行处理,建立员工互联网偏好模型,通过员工互联网偏好模型进行员工访问网络的时间段偏好分析、员工访问网络的应用偏好分析以及员工访问网络的URL类型偏好分析。
其建模及分析的具体过程如下:
S31,在数据源中提取最近一周或一月的URL数据表;
S32,对S31步骤中的URL数据表按照gw_id,URL做汇总,取sum(hit_num)作为汇总统计量,将此点击量的汇总统计量作为最近一周或一月的URL网站访问热度指标;
S33,在数据源中提取最近一周或一月的流量数据表;
S34,在S33步骤中的流量数据表增加traffic字段,使用公式:
traffic=traffic_up+traffic_down,得到新的数据表;
S35,对S34步骤中得到的数据表按照gw_id,app_name做汇总计算,取sum(traffic)作为汇总统计量,将此流量的汇总统计量作为最近一周或一月的app使用热度指标。
S4,对数据源中的数据进行处理,建立员工情绪模型,通过员工情绪模型进行员工访问招聘类网站的时间段分析、员工访问招聘类网站的频度分析;
其建模及分析的具体过程如下:
S41,在数据源中提取最近一周或一月的URL数据表,其中URL_type=33619968(招聘类);
S42,对S41步骤中的数据表按照gw_id,time_dim进行汇总,汇总统计量取sum(hit_num);
S43,对S42步骤中点击量总数按倒序排序,即为最近一周或一月的各时段访问招聘网站的热度排名结果;
S44,对S41步骤中的URL数据表按照gw_id,time_dim,user_id,user_name进行汇总,得到新的数据表;
S45,对S44步骤中得到的数据表按照gw_id,time_dim汇总,取size()作为汇总统计量,该统计量即为不同员工在该时段访问招聘网站的次数。
S5,对数据源中的数据进行处理,建立员工工作负荷模型,通过员工工作负荷模型进行员工工作时间的分析和员工访问工作相关网站时间段分析;
其建模及分析的具体过程如下:
S51,在数据源中提取URL数据表;
S52,在S51步骤的URL数据表中进一步提取可识别URL(URL_type不等于NULL)形成数据表;
S53,对S52步骤形成的数据表按照gw_id,user_id,user_name,time_dim,URL_type进行汇总,取size()作为汇总统计量;
S54,将URL_type=“生产类”的网站有点击行为的用户定义为工作状态,在S52步骤形成的数据表中添加新字段work_status信息,将生产类网站有点击行为定义为工作状态;
S55,对S54步骤得到的数据表中的表状态work_status赋值,当同一个用户处于工作状态时,其状态只要不连续出现非工作状态,则偶现的非工作状态会被修正为工作状态;
S56,汇总计算S55得到的步骤数据表中time_dim的开始时段(上班开始时段)、结束时段(下班开始时段)、中间时段(工作时长);
S57,对S54步骤得到的数据表进行汇总计算,汇总统计量按time_date取sum(hit_num),即获得生产类URL的日点击总数,再按日期排序即可得到生产类网站的访问趋势。
S6,将S2-S5的分析结果通过网页进行展示。
本发明尚有多种实施方式,例如S2-S5步骤的具体顺序可以进行调整,凡采用等同变换或者等效变换而形成的所有技术方案,均落在本发明的保护范围之内。
机译: 用于移动设备的基于位置的服务应用程序使用情况分析系统,用于分析移动网络上基于位置的服务应用程序使用情况的分析服务器以及由移动设备在移动网络上提供基于应用程序的位置分析的方法
机译: 自动化音乐创作和生成系统,自动化音乐创作和生成过程,自动化音乐创作和生成,玩具乐器,音乐伴奏和音乐创作玩具乐器,自动化创作玩具乐器系统和音乐生成,电子信息处理和显示系统,企业基于互联网的一流音乐创作和生成系统,用于自动生成和传送数字复合音乐的网络系统,用于音乐环境的基于独立音乐的音乐创作和表演系统人工智能,基于音乐的自主创作过程音乐的生成和表演人工智能,自主分析仪器系统,用于建立自动音乐创作和生成引擎的网络,几何方法音乐理论系统操作参数映射,以自动方式构成和生成数字音乐的方法,参数转换
机译: 使用医疗系统分析单元分析医疗系统运行模式的方法,包括基于医疗系统运行模式的分析,确定系统外部辅助设备提供的制造商数据。