首页> 中国专利> 基于循环神经网络预测移动用户间相遇概率的方法

基于循环神经网络预测移动用户间相遇概率的方法

摘要

本发明公开了一种基于循环神经网络预测移动用户间相遇概率的方法,主要解决现有的预测移动用户间相遇概率准确率低、对移动用户节点的存储能力、计算能力要求较高的缺点。其实现步骤是:(1)移动用户采集历史数据;(2)获得蓝牙物理地址MAC序列;(3)获得用户间相遇时间序列;(4)将蓝牙物理地址MAC序列向量化;(5)训练循环神经网络LSTM;(6)预测用户间相遇概率。本发明通过移动用户采集历史数据,构建循环神经网络,实现移动用户间相遇概率的预测,提高了预测准确度,降低了对用户节点的存储、计算能力的依赖。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-01-07

    授权

    授权

  • 2018-11-09

    实质审查的生效 IPC(主分类):H04W4/80 申请日:20180410

    实质审查的生效

  • 2018-10-16

    公开

    公开

说明书

技术领域

本发明属于通信技术领域,更进一步涉及移动网络技术领域中的一种基于循环神经网络预测移动用户间相遇概率的方法。本发明通过循环神经网络对移动用户的历史行为数据进行训练,得到移动用户间相遇概率的预测模型,从而利用该预测模型预测出移动用户间的相遇概率。本发明可在移动网络中数据的路由转发过程中,选择耗时最少、效率最高的路径进行数据转发,提高数据传输成功率。

背景技术

移动机会网络是通过利用用户的移动带来的相遇机会以“存储-携带-转发”的形式实现节点之间通信的一种移动网络,因此机会网络应用中最基本的前提就是需要用户之间的相互接触、协作来转发数据,对移动机会网络中节点的相遇行为进行分析,是移动机会网络中数据路由转发的基础。

同济大学在其申请的专利文献“一种机会网络的相遇预测和距离感知的路由转发方法及系统”(申请号:201710164228.8,申请公布号:CN107124750A)中提出了一种机会网络的相遇预测和距离感知的路由转发方法。该方法首先获取机会网络中节点之间交换信息,构成节点网络关联图;然后获取每一节点收集相邻节点的转发条件信息;最后机会网络中的源节点或前转发节点根据转发条件信息对相邻节点进行转发节点判断及目标节点判断。但是,该方法存在的不足之处是,在信息收集模块,该方法包含了距离值收集模块、相遇概率模块、邻接点概率收集模块、转发条件模块和条件信息存储模块,这种数据实时收集与相遇概率计算对用户节点数据存储量和计算能力要求较高。

华南理工大学在其申请的专利文献“一种基于卷积神经网络的移动用户行为预测方法”(申请号:201710243498.8,申请公布号:CN107153887A)中提出了一种预测用户移动行为的方法。该方法首先对移动用户历史数据进行特征处理;然后根据历史记录数选择卷积用户,构建卷积用户的二维历史数据单元,对卷积神经网络行为预测模型进行训练;最后判读目标用户为卷积预测目标用户,构建二维目标用户数据单元输入卷积神经网络行为预测模型,预测得到目标用户各个行为标签的概率。该方法存在的不足之处是,对移动用户历史数据记录,按时间先后顺序进行排列,组成卷积神经网络的输入序列,而卷积神经网络对于输入上下文没有记忆功能,不能对用户历史数据产生很好的记忆功能,因此,对于用户间相遇预测会产生较大的误差,准确率较低。

发明内容

本发明的目的在于针对上述现有技术存在的用户节点存储量大、计算能力要求高、准确率低的缺点,提供一种基于循环神经网络预测移动用户间相遇概率的方法。

实现本发明目的的思路是,该方法是在移动用户采集历史数据的前提下,获得蓝牙物理地址MAC(Media Access Control)序列和用户间相遇时间序列,将蓝牙物理地址MAC序列向量化,训练循环神经网络LSTM(Long Short-Term Memory),实现用户间相遇概率的预测。

实现本发明目的的具体步骤如下:

(1)移动用户采集历史数据:

利用移动用户的智能终端中的蓝牙,采集15天内移动用户间蓝牙扫描的原始数据集;

(2)获得蓝牙物理地址MAC序列:

(2a)从原始数据集中选取扫描时间戳和用户的蓝牙物理地址MAC两组数据;

(2b)将用户蓝牙物理地址MAC组中蓝牙物理地址MAC相同的归为一类,将归类后的蓝牙物理地址MAC,按照与其对应的扫描时间戳时间的先后排序,得到多个类别的相遇用户的蓝牙物理地址MAC序列;

(3)获得用户间相遇时间序列:

(3a)每隔5分钟的时间内,依次从蓝牙物理地址MAC序列中提取蓝牙物理地址MAC;

(3b)从提取蓝牙物理地址MAC中的每一组子序列中,将第一个蓝牙物理地址MAC所对应的扫描时间戳为相遇开始时间;将最后一个蓝牙物理地址MAC所对应的扫描时间戳为相遇结束时间;将相遇结束时间减去相遇开始时间,作为相遇持续时间;

(3c)将每一组子序列得到的蓝牙物理地址MAC、相遇开始时间、相遇结束时间、相遇持续时间组成一条数据记录;

(3d)选取相遇持续时间大于相遇持续时间的数据记录,相遇持续时间的取值由移动网络中待传输的数据量的大小确定;

(3e)对每一条数据记录中相遇开始时间的数据记录按照先后排序,组成用户间相遇时间序列;

(4)将蓝牙物理地址MAC序列向量化:

(4a)从相遇时间序列数据集中,按照相遇开始时间的先后顺序,依次提取与每个相遇开始时间对应的蓝牙物理地址MAC,将所有的蓝牙物理地址MAC组成蓝牙物理地址MAC序列;

(4b)利用Word2Vec模型中的Skip-gram算法,对蓝牙物理地址MAC序列进行向量化处理,得到蓝牙物理地址MAC序列所对应的向量序列;

(5)训练循环神经网络LSTM:

(5a)将蓝牙物理地址MAC序列所对应的向量序列,依次提取长度相等的向量子序列,其中,向量子序列的长度取值大于等于2,由所有向量子序列组成训练样本集;

(5b)搭建一个循环神经网络LSTM,输入层节点数为x;输出层节点数为y,输出层激活函数采用Softmax激活函数,其中,x与y的取值相等,其大小与输入向量的维数相等;

(5c)将训练样本集中每个向量子序列的最后一个向量作为循环神经网络LSTM的输出,其它向量作为循环神经网络LSTM的输入,进行模型训练,得到移动用户间相遇预测模型;

(6)预测用户间相遇概率:

将历史数据中所获得的用户间相遇蓝牙物理地址MAC序列所对应的向量序列,按照相遇起始时间的先后顺序,依次输入到移动用户间相遇预测模型中,得到下一个用户间相遇概率。

与现有技术相比,本发明具有以下优点:

第一,由于本发明首先利用移动用户的智能终端中的蓝牙,采集移动用户间蓝牙扫描所获取的扫描时间、扫描时间戳、用户蓝牙名称、用户的蓝牙物理地址MAC数据,获得相遇开始时间、相遇结束时间、相遇持续时间,生成用户间相遇时间序列,然后建立用户间的相遇概率预测模型。通过对数据的收集、分析和对用户间相遇概率预测相分离的方法,克服了现有技术中数据的实时收集和实时分析对用户节点所造成的存储空间使用量大和计算能力要求高的缺点。使得本发明能够节省移动用户节点的存储和计算资源。

第二,本发明通过采集移动用户间蓝牙扫描所获取的扫描时间、扫描时间戳、用户蓝牙名称、用户的蓝牙物理地址MAC数据,生成用户间相遇时间序列,利用循环神经网络(LSTM)对用户间相遇时间序列进行训练,预测移动用户相遇概率,克服了现有技术中对用户间相遇概率预测准确率低的缺点。使得本发明能够更加准确的预测用户间相遇的概率。

附图说明

图1为本发明的流程图;

图2为本发明蓝牙物理地址MAC序列向量化流程图。

具体实施方法

下面结合附图对本发明作进一步的描述。

参照图1的流程图,对本发明实现的具体步骤作进一步的描述。

步骤1,移动用户采集历史数据。

利用移动用户的智能终端中的蓝牙,采集15天内移动用户间蓝牙扫描的原始数据集。

参照如下所示移动用户采集的历史数据,原始数据集包括扫描时间、扫描时间戳、扫描到的用户蓝牙名称、扫描到用户的蓝牙物理地址MAC数据。

步骤2,获得蓝牙物理地址MAC序列。

从原始数据集中选取扫描时间戳和用户的蓝牙物理地址MAC两组数据。

将用户蓝牙物理地址MAC组中蓝牙物理地址MAC相同的归为一类,将归类后的蓝牙物理地址MAC,按照与其对应的扫描时间戳时间的先后排序,得到多个类别的相遇用户的蓝牙物理地址MAC序列。

步骤3,获得用户间相遇时间序列。

每隔5分钟的时间内,依次从蓝牙物理地址MAC序列中提取蓝牙物理地址MAC。

从提取蓝牙物理地址MAC中的每一组子序列中,将第一个蓝牙物理地址MAC所对应的扫描时间戳为相遇开始时间;将最后一个蓝牙物理地址MAC所对应的扫描时间戳为相遇结束时间;将相遇结束时间减去相遇开始时间,作为相遇持续时间。

将每一组子序列得到的蓝牙物理地址MAC、相遇开始时间、相遇结束时间、相遇持续时间组成一条数据记录。

选取相遇持续时间大于相遇持续时间的数据记录,相遇持续时间的取值由移动网络中待传输的数据量的大小确定。

对每一条数据记录中相遇开始时间的数据记录按照先后排序,组成用户间相遇时间序列。

步骤4,将蓝牙物理地址MAC序列向量化。

从相遇时间序列数据集中,按照相遇开始时间的先后顺序,依次提取与每个相遇开始时间对应的蓝牙物理地址MAC,将所有的蓝牙物理地址MAC组成蓝牙物理地址MAC序列。

利用Word2Vec模型中的Skip-gram算法,对蓝牙物理地址MAC序列进行向量化处理,得到蓝牙物理地址MAC序列所对应的向量序列。

参照图2蓝牙物理地址MAC序列向量化流程图,对Word2Vec模型中的Skip-gram算法的具体步骤描述如下。

第1步,用参数为1的滑动窗口,从蓝牙物理地址MAC序列中,依次提取蓝牙物理地址MAC,组成训练数据集。

第2步,将训练数据集中的每个蓝牙物理地址MAC,随机初始化为维度为n的向量,n表示蓝牙物理地址MAC序列中的蓝牙物理地址MAC的总数。

第3步,搭建一个全连接神经网络模型,该模型的输入为p维的向量,隐藏层节点个数为m个,隐藏层的权重矩阵为p×m的矩阵;输出层节点个数为q个,输出层权重矩阵为m×q的矩阵;其中,p与q的取值相等,其大小与与蓝牙物理地址MAC的总数相等。

第4步,将训练数据集输入到全连接神经网络中进行训练,得到蓝牙物理地址MAC序列所对应的向量序列。

步骤5,训练循环神经网络LSTM。

将蓝牙物理地址MAC序列所对应的向量序列,依次提取长度相等的向量子序列,其中,向量子序列的长度取值大于等于2,由所有向量子序列组成训练样本集。

搭建一个循环神经网络LSTM,输入层节点数为x;输出层节点数为y,输出层激活函数采用Softmax激活函数,其中,x与y的取值相等,其大小与输入向量的维数相等。

将训练样本集中每个向量子序列的最后一个向量作为循环神经网络LSTM的输出,其它向量作为循环神经网络LSTM的输入,进行模型训练,得到移动用户间相遇预测模型。

步骤6,预测用户间相遇概率。

将历史数据中所获得的用户间相遇蓝牙物理地址MAC序列所对应的向量序列,按照相遇起始时间的先后顺序,依次输入到移动用户间相遇预测模型中,得到下一个用户间相遇概率。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号