公开/公告号CN112749745A
专利类型发明专利
公开/公告日2021-05-04
原文格式PDF
申请/专利权人 中移(成都)信息通信科技有限公司;东联信息技术有限公司;
申请/专利号CN202110024060.7
申请日2021-01-08
分类号G06K9/62(20060101);G06Q50/30(20120101);H04W24/08(20090101);H04W52/02(20090101);
代理机构51124 成都虹桥专利事务所(普通合伙);
代理人吴中伟
地址 610041 四川省成都市中国(四川)自由贸易试验区成都高新区和乐二街150号1号楼2单元
入库时间 2023-06-19 10:51:07
技术领域
本发明涉及大数据领域,具体涉及一种基于机器学习的5G基站小区业务场景自动识别方法。
背景技术
在工业互联网领域,实现工业设备的节能降耗目标,实现绿色发展,降本增效,是企业发展的重点方向。
做为新基建建设的5G网络,要承载新基建的任务,将支持各种各样复杂的网络应用,有为传统网络数据应用提供更高的带宽,更短时延,从而助力应用升级,网络建设成本降低;有对创新的产品应用提供定制化的网络切片管理通道支持。
因此,在各种应用风起云涌的今天,传统的对于3G,4G业务模型的小区场景识别归类方法,难以表达目前5G网络的发展新趋势。
现有技术主要通过数据分析,进行以下分类:
(1)基于指定小区扩容规划标准的目的,将业务量与用户数的比值,区分“大包传输”、“小包传输”、“中包传输”小区。因此所设的扩容门限:小包<中包<大包。
(2)小区场景的归类,主要依据无线基站所在的地理区域进行划分,包括商超场景、学校场景、写字楼场景、密集城区、郊区等。
(3)用户行为特征分类,按照无线小区规划的需要,分为室内用户、室外用户,低移动特性用户及高移动特性用户,从而将无线小区所覆盖的场景划分为室内场景、室外场景,低移动性区域、高移动性区域。
上述技术的缺陷为:
(1)从无线网络规划及无线网优的角度出发,进行的场景划分,没有从能耗管理、以节能为目的进行小区特征归类。
(2)大小包的分类,是以统计数据的日、周、月平均值做为计算依据,不能反映更细日期粒度的变化情况。
(3)由于缺乏统计学方法,对于混合型的场景,比如同时覆盖写字楼和高速路的小区,不能准确识别出场景类型,无法体现对应的小区业务特征。
发明内容
本发明的目的是提供一种基于机器学习的5G基站小区业务场景自动识别方法,实现了对小区业务场景的自动识别,极大地提高了小区业务场景识别的准确度。
本发明采取如下技术方案实现上述目的,基于机器学习的5G基站小区业务场景自动识别方法,包括:
步骤(1)、获取各小区每小时的话务量数据、PRB(Physical Resource Block)利用率以及业务切换次数;
步骤(2)、将PRB利用率以及业务切换次数进行归一化或标注化处理;
步骤(3)、将每天的话务量数据整合为多个时间段的话务量数据,然后加入处理后的PRB利用率以及业务切换次数形成多维话务量数据;
步骤(4)、通过主成分分析将多维话务量数据降为二维话务量数据;
步骤(5)、引入轮廓系数分析和业务逻辑将二维话务量数据聚为多个类别;
步骤(6)、通过高斯混合模型对二维话务量数据进行分类别聚类,根据聚类结果自动识别小区场景。
进一步的是,在步骤(1)中,获取相应数据后,对数据缺失值用均值进行填充,并剔除大于设定阈值的数据值。
进一步的是,在步骤(2)中,所述标准化处理的公式为,x'=(x-u)/δ,x为样本数据,μ为所有样本数据的均值,δ为所有样本数据的标准差。
进一步的是,在步骤(2)中,所述归一化处理的公式为,max(x)为样本数据的最大值,min(x)为样本数据的最小值。
进一步的是,在步骤(3)中,将每天的话务量数据整合之前还包括:计算每小时话务量数据占对应一天话务量数据的百分比。
进一步的是,在步骤(6)中,通过高斯混合模型对二维话务量数据进行分类别聚类得到的结果包括属于每个小区业务场景的概率,根据相应概率对各个小区业务站点进行节能门限的阈值调控。
本发明对各个小区每小时的话务量进行了统计,对话务量数据进行分时段整合,从更细致维度的数据变化体现小区业务场景类型,并且加入了PRB利用率以及业务切换次数,PRB利用率可以得出各个小区业务站点的使用情况,业务切换次数可以区分连接较多的业务站点,形成多维数据后,在通过降维处理,引入相关模型进行聚类分析,再根据分析结果自动识别小区业务场景,极大地提高了小区业务场景识别的准确度,根据聚类后得到相应概率对各个小区业务站点进行节能门限的阈值调控,还实现了节能控制。
附图说明
图1是本发明不同场景流量占比24小时趋势。
图2是本发明基于机器学习的5G基站小区业务场景自动识别的方法流程图。
具体实施方式
本发明基于机器学习的5G基站小区业务场景自动识别方法,其方法流程图如图2,包括:
步骤101、获取各小区每小时的话务量数据、PRB利用率以及业务切换次数;
步骤102、将PRB利用率以及业务切换次数进行归一化或标注化处理;
步骤103、将每天的话务量数据整合为多个时间段的话务量数据,然后加入处理后的PRB利用率以及业务切换次数形成多维话务量数据;
步骤104、通过主成分分析将多维话务量数据降为二维话务量数据;
步骤105、引入轮廓系数分析和业务逻辑将二维话务量数据聚为多个类别;
步骤106、通过高斯混合模型对二维话务量数据进行分类别聚类,根据聚类结果自动识别小区场景。
在步骤101中,获取相应数据后,对数据缺失值用均值进行填充,并剔除大于设定阈值的数据值。
在步骤102中,所述标准化处理的公式为,x'=(x-u)/δ,x为样本数据,μ为所有样本数据的均值,δ为所有样本数据的标准差。
在步骤102中,所述归一化处理的公式为,max(x)为样本数据的最大值,min(x)为样本数据的最小值。
在步骤103中,将每天的话务量数据整合之前还包括:计算每小时话务量数据占对应一天话务量数据的百分比。
在步骤106中,通过高斯混合模型对二维话务量数据进行分类别聚类得到的结果包括属于每个小区业务场景的概率,根据相应概率对各个小区业务站点进行节能门限的阈值调控,实现了节能控制。
图1是本发明不同场景流量占比24小时趋势图,可以看出不同场景下24小时中,话务流量的变化,其中场景一话务流量在0点以后逐步下降趋近与0在5点以后逐渐恢复,到7点8点出现明显高峰,然后小幅回落保持在较高水平;场景二话务流量从0点以后逐步下降为0,10点到16点小幅回升,16点以后快速回升并在19点至20点达到高峰;场景三话务流量从0点以后逐步下降为0,5点以后逐步恢复,在17点至18点达到高峰后逐步下降;场景四话务流量从0点以后出现小幅回落,3点以后开始逐步回升,在8点至9点达到第一个高峰后出现一定回落,又在21点达到第二个高峰后开始逐步回落。
监测全天每小时话务流量数据变化可以从更小的维度体现小区业务场景类型,PRB利用率可以近似得出各时间段站点使用情况,加入切换次数为了更好的区分出比如医院,高铁站点等客户连接较多的VIP站点,使得能够更好的区分混合场景。
综上所述,本发明实现了对小区业务场景的自动识别,极大地提高了小区业务场景识别的准确度。
机译: 基于HANA的多种场景仿真,可为复杂的业务流程实现自动决策
机译: DMB系统的基于CBS的紧急广播业务自动识别方法及装置
机译: DMB系统基于CBS的紧急广播业务自动识别方法及装置