首页> 中国专利> 基于数据库的话务量分析与预测系统及使用该系统的话务量预测方法

基于数据库的话务量分析与预测系统及使用该系统的话务量预测方法

摘要

基于数据库的话务量分析与预测系统及使用该系统的话务量预测方法,它涉及一种话务量分析与预测系统和一种话务量预测方法,它解决了目前的话务量分析与预测系统和话务量预测方法中存在的预测精度和数据利用率较低的问题。话务量分析与预测系统,它包括数据库单元和SAS预测功能单元,数据库单元主要用于存储话务量数据和预测结果数据,SAS预测功能单元主要采用时间序列分析技术对话务量进行预测;话务量预测方法,基于所述话务量分析与预测系统实现,利用SAS预测功能单元实现话务量数据的读取、缺失时段的查找和处理、建模以及话务量未来值的预测。本发明克服了已有技术的不足,适用于移动通信的话务量预测领域。

著录项

  • 公开/公告号CN101778400A

    专利类型发明专利

  • 公开/公告日2010-07-14

    原文格式PDF

  • 申请/专利权人 哈尔滨工业大学;

    申请/专利号CN201010300133.2

  • 申请日2010-01-08

  • 分类号H04W16/22(20090101);H04W24/06(20090101);G06F17/30(20060101);

  • 代理机构23109 哈尔滨市松花江专利商标事务所;

  • 代理人王吉东

  • 地址 150001 黑龙江省哈尔滨市南岗区西大直街92号

  • 入库时间 2023-12-18 00:05:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-03-12

    未缴年费专利权终止 IPC(主分类):H04W16/22 授权公告日:20120627 终止日期:20130108 申请日:20100108

    专利权的终止

  • 2012-06-27

    授权

    授权

  • 2010-09-15

    实质审查的生效 IPC(主分类):H04W16/22 申请日:20100108

    实质审查的生效

  • 2010-07-14

    公开

    公开

说明书

技术领域

本发明涉及一种话务量分析与预测系统和一种话务量预测方法。

背景技术

目前移动通信的用户数和话务量保持着高速增长的势头,移动网络长久、稳定的运行,有赖于及时、有效的移动网络规划与优化。移动通信话务量超过一定容量时,极易造成交换系统过载,出现网络拥塞,给移动通信运营商和用户造成不可弥补的损失。因此,根据话务统计资料和其他业务信息对移动通信话务量的变化趋势进行预测,可以为移动通信网络运行过程中峰值预警、基站配置、信道优化利用等问题提供决策支持。

移动通信运营商对于其移动通信网络的话务量按照时间尺度(一般是小时)和空间尺度(一般是话务小区)上都进行了记录,从而形成了海量的历史数据。但是运营商对于话务量的预测中,并未有效利用这些话务量数据,而大多采用人为的、定性的、基于经验的预测,预测精度低,造成在提高服务质量(降低掉线率)、网络扩容等过程中往往没有基于实际数据的客观依据支持,带来了通信网络容量冗余大、网络利用率低、重复投资严重等问题。

发明内容

本发明的目的是解决目前的话务量分析与预测系统和话务量预测方法中存在的预测精度低、数据利用率低的问题,提供了一种基于数据库的话务量分析与预测系统及使用该系统的话务量预测方法。

基于数据库的话务量分析与预测系统,包括数据库单元和SAS预测功能单元。数据库单元,用于以自动脚本的形式定期通过FTP协议从外部服务器上获取原始数据,并在导入原始数据后,完成数据清理,用于在以“小时”为时间尺度的数据基础上,提供不同时间尺度及不同空间尺度的话务量数据,用于接收并保存SAS预测功能单元输出的预测结果数据,还用于提供外部数据接口;

SAS预测功能单元,用于从数据库单元中读取需处理的数据并存储数据结果,用于利用时间序列分析技术对话务量进行预测,并将预测结果数据发送给数据库单元。

使用上述基于数据库的话务量分析与预测系统的话务量预测方法,它的过程如下:

步骤一、SAS预测功能单元读取数据库单元中的话务量数据,将所需的记录时间、小区名称、话务量数据导入至SAS预测功能单元的逻辑库中,并根据需要进行数据格式转换,生成话务量数据集;

步骤二、SAS预测功能单元对步骤一获得的话务量数据集进行缺失时段查找,并对缺失时段进行数据补缺处理,获得数据补缺处理后的话务量数据集;

步骤三、SAS预测功能单元2对步骤二获得的话务量数据集进行模型识别,获得所述话务量数据集符合的模型结构,然后估计模型中的参数,建立模型;

步骤四、对步骤三获得的模型进行检验,判断该模型是否适用:若是,则执行步骤五;否则,返回执行步骤三;

步骤五、利用建立的模型,对话务量数据集的未来值进行预测,获得预测结果数据再将获得的预测结果数据保存至数据库单元1中。

利用本发明的话务量分析与预测系统及话务量预测方法,对移动通信话务量进行预测时,具有预测精度高、数据利用率高的优点。

附图说明

图1为本发明的话务量分析与预测系统的结构示意图;图2为包括用户接口单元的话务量分析与预测系统的结构示意图;图3为数据库单元的结构示意图;图4为SAS预测功能单元的结构示意图;图5为用户接口单元的结构示意图;图6为本发明的话务量预测方法的流程图。

具体实施方式

具体实施方式一:本实施方式的基于数据库的话务量分析与预测系统,它包括数据库单元1和预测功能单元2,参见图1,

数据库单元1,用于以自动脚本的形式定期通过FTP协议从外部服务器上获取原始数据,并在导入原始数据后,完成数据清理,用于在以“小时”为时间尺度的数据基础上,提供不同时间尺度及不同空间尺度的话务量数据,用于接收并保存SAS预测功能单元2输出的预测结果数据,还用于提供外部数据接口;

SAS预测功能单元2,用于从数据库单元1中读取需处理的数据并存储数据结果,用于利用时间序列分析技术对话务量进行预测,并将预测结果数据发送给数据库单元1。

SAS(Statistical Analysis System)是统计分析系统。

参见图2,它还包括用户接口单元3,所述用户接口单元3,用于提供用户交互界面,还用于将用户输入的参数传递给SAS预测功能单元2,还用于调用数据库单元1的数据,还用于将数据库单元1中的预测结果可视化输出;

所述数据库单元1,还用于向用户接口单元3提供数据;

SAS预测功能单元2,还用于提供外部调用接口供用户接口单元3调用,接收来自用户接口单元3的参数。

参见图3,所述数据库单元1由Shell脚本模块11和数据库模块12组成,

所述Shell脚本模块11,用于以自动脚本的形式定期通过FTP协议从外部服务器上获取原始数据,并将获得的原始数据导入数据库模块12;

数据库模块12,用于在导入原始数据后,完成数据清理,用于在以“小时”为时间尺度的数据基础上,提供不同时间尺度及不同空间尺度的话务量数据,用于接收并保存SAS预测功能单元2输出的预测结果数据,用于向用户接口单元3提供数据,还用于提供外部数据接口。其中外部数据接口可用于与其他系统间传送数据。

参见图4,所述SAS预测功能单元2由数据库接口模块21、预测功能模块22和外部调用接口模块23组成,

数据库接口模块21,用于从数据库单元1中读取需处理的数据并存储数据结果,用于将预测功能模块22输出的预测结果数据转发给数据库单元1;

预测功能模块22,用于利用时间序列分析技术对话务量进行预测,并将预测结果数据发送给数据库接口模块21;

外部调用接口模块23,用于提供外部调用接口实现供用户接口单元3调用,接收来自用户接口单元3的参数。

参见图5,所述用户接口单元3由SAS调用模块31、用户界面模块32、结果呈现模块33和数据库接口模块34组成,

所述SAS调用模块31,用于向SAS预测功能单元2传递参数;

用户界面模块32,用于提供用户交互界面;

结果呈现模块33,用于通过数据库接口模块34调用数据库单元1的预测结果数据,并将所述预测结果数据可视化输出;

数据库接口模块34,用于调用数据库单元1的数据。

针对系统功能的具体实现与接口问题,话务量分析与预测系统以数据库形式提供与其他系统的接口,同时,采用B/S架构保证系统具有良好的人机交互界面,并为分析话务量数据提供直观的可视化呈现。为了保证系统功能的外部扩展性,本实施方式以数据库为外部接口,开发话务量分析与预测系统,并提供话务量分析,构建数据存储、用户交互、数据呈现等框架。

话务量分析与预测系统使用的数据来自IBM Informix抽取生成的文本文件,为便于存储以及便于使用SQL语言根据不同的条件提取数据,因此将获得的数据文本文件导入至系统的本地数据库。同时,系统将预测结果保存至数据库中,以方便其他系统获取预测结果。

数据库单元1选择Oracle 10g企业版数据库来存储原始数据及预测结果数据。通过制定系统定时任务在非工作时间(如凌晨)使用shell脚本自动下载原始文件,然后调用Oracle数据库自带的Sql Loader实用程序完成原始文件入库,再使用存储过程对原始文件补缺处理,这样保证每日原始数据均能完整、有效,同时可以满足本系统对任何数据库里保存的时间点进行统计分析的需要。在数据存储方面,目前每日原始数据约在50万条左右,每条数据约120个字节,每日占用数据空间约为58MB,年数据约量21GB,考虑到索引、临时空间等占用的磁盘空间,在不使用外接存储设备的情况下使用146GB的磁盘可保存3年以上的原始数据。在提高数据读取速度方面,在使用多个硬盘的情况下,使用Raid 10型磁盘阵列,并创建多个系统分区供Oracle数据库的数据文件使用,同时对导入的原始数据使用分区表保存,通过Oracle数据库语言中的Job功能语句按照时间区间在每月初自动创建数据库表分区,以获得较高的读取速度。还可以根据实际情况,针对原始数据表的小区名称字段添加位图索引、记录时间字段添加函数索引,使数据查询速度获得进一步的提高。

在话务量分析与预测系统中,采用SAS实现预测功能,SAS选用的是SAS 9.1.3 forWindows的版本。在数据库接口模块设计中,利用SAS/ACCESS模块进行与Oracle数据库的对接,采用SQL语言按照需要从数据库读取数据和存储数据,实现对数据库的访问。在预测功能模块的开发中,采用SAS/ETS模块,利用ARIMA模型实现话务量预测功能。另外,基于SAS/IT模块实现SAS的外部调用接口,与用户接口软件部分对接,实现用户设置参数的传递。其中所述SAS/ACCESS模块、SAS/ETS模块和SAS/IT模块都是SAS系统中的常用模块。

在话务量分析与预测系统中,采用Java语言进行用户接口单元3的设计开发。

具体实施方式二:结合图6说明本实施方式,本实施方式是使用实施方式一的基于数据库的话务量分析与预测系统的话务量预测方法,它的过程如下:

步骤一、SAS预测功能单元2读取数据库单元1中的话务量数据,将所需的记录时间、小区名称、话务量数据导入至SAS预测功能单元2的逻辑库中,并根据需要进行数据格式转换,生成话务量数据集;

步骤二、SAS预测功能单元2对步骤一获得的话务量数据集进行缺失时段查找,并对缺失时段进行数据补缺处理,获得数据补缺处理后的话务量数据集;

步骤三、SAS预测功能单元2对步骤二获得的话务量数据集进行模型识别,获得所述话务量数据集符合的模型结构,然后估计模型中的参数,建立模型;

步骤四、对步骤三获得的模型进行检验,判断该模型是否适用:若是,则执行步骤五;否则,返回执行步骤三;

步骤五、利用建立的模型,对话务量数据集的未来值进行预测,获得预测结果数据再将获得的预测结果数据保存至数据库单元1中。

步骤一为数据读取阶段,主要使用SAS中的infile语句实现。

步骤二为数据预处理阶段。由于系统故障或其他因素影响,话务量数据中难免存在数据缺失的情况。在数据预处理阶段,主要完成缺失时段的查找和处理。虽然SAS的PROC ARIMA过程步提供了缺失值处理功能,但会严重影响建模预测的速度。因此,本文预先对数据进行缺失值处理。此外,在数据预处理阶段,根据后续建模预测需要提供对数变换处理。

步骤三为建模预测阶段,主要利用PROC ARIMA过程步实现。PROC ARIMA的功能主要由三个语句实现:IDENTIFY、ESTIMATE、FORECAST。其中,IDENTIFY语句用于指定分析对象序列并给出有利于识别模型结构的分析结果如自相关系数、偏自相关系数等。此外,根据序列本身的特点,可对序列进行差分处理。ESTIMATE语句用于估计模型参数,建立合适的模型来拟合序列。同时,ESTIMATE语句通过生成对模型拟合残差的白噪声检验结果以及AIC值,以判断建立模型合适与否。乘积季节ARIMA模型的阶数通常在2阶以内,本实施方式可遍历所有可能的阶数组合,基于AIC最小准则确定最佳模型结构。根据ESTIMATE建立的模型,FORECAST语句用于对时间序列的未来值进行预测。AIC为Akaike’s Information Criterion的简称,表示Akaike信息量准则的意思。

步骤二所述的对缺失时段进行数据补缺处理的过程为:

获得缺失时段所在周期,然后找到缺失时段所在周期的相邻周期,并在所述相邻周期内获得与缺失时段处于相同时段的话务量数据,然后计算获得的话务量数据的等权均值,再利用此等权均值替代缺失时段填补入话务量数据集中。其中,当缺失时段所在周期不是话务量数据集的首、尾周期时,该缺失时段所在周期的相邻周期为两个。

步骤三所述的对步骤二获得的话务量数据集进行模型识别,获得所述话务量数据集符合的模型结构的具体过程为:

利用IDENTIFY语句对步骤二获得的话务量数据集进行差分处理,获得自相关系数及偏自相关系数等系数,进而获得所述话务量数据集符合的模型结构。根据话务量数据集本身的特点,可对其进行差分处理。

步骤三所述的对步骤二获得的话务量数据集进行模型识别,获得所述话务量数据集符合的模型结构的具体过程为:利用IDENTIFY语句对步骤二获得的话务量数据集进行处理,获得自相关系数及偏自相关系数,进而获得所述话务量数据集符合的模型结构;

所述估计模型中的参数的具体过程为:利用ESTIMATE语句估计模型中的参数,且所述估计模型中的参数时所选用的估计方法为最大似然估计法。

步骤四所述的对步骤三获得的模型进行检验,判断该模型是否适用的具体过程为:通过ESTIMATE语句生成对模型拟合残差的白噪声检验结果以及AIC值,判断建立的模型是否适用,判断的准则为AIC最小准则。

SAS提供的参数估计方法包括:最大似然估计法、条件最小二乘法以及非条件最小二乘法。最大似然估计法在某些情况下,可以得到比后两种方法更合理的估计,但是其计算开销也相对较大。在本发明的数据预测中,三种方法的时间开销相差极小,因此,本发明选取最大似然估计法进行参数估计。

步骤三所述的对话务量数据集的未来值进行预测是利用FORECAST语句实现的。

需要指出的是,建模预测阶段的时间开销主要消耗在建模过程,在建模数据长度较大、模型阶数较高时,尤为明显。

本实施方式根据移动通信话务量数据,采用时间序列分析技术,对移动通信话务量数据进行分析,并实现对移动通信话务量小区的特征分析以及按照话务量特点进行小区的细分和归类,采用适合的时间序列预测模型对多尺度的话务量数据进行有效预测,从而为移动通信网络管理、维护等提供技术支持和保障,同时也可为相关的决策提供支持。

发明成果可直接用于中国移动通信集团(黑龙江)有限公司网络管理系统或其他类似的网络管理系统,提供开放的话务量分析和预测的数据库标准接口,可丰富和完善网络管理系统。

根据网络话务量预测和分析的结果,有针对性地开展网络建设、网络改造和网络维护,将有效降低网络运营成本,降低维护过程费用的投入,创造良好的经济效益。

本发明的话务量预测方法可以为网络管理提供一定的借鉴,对于提高移动通讯网络服务质量,开展更加科学合理的决策,对于提升移动通信网络综合业务质量状态具有很好的补充作用,由此可带来经济效益与社会效益的提升。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号