首页> 中国专利> 使用深度学习的多用户多输入多输出波束选择和用户配对的方法和装置

使用深度学习的多用户多输入多输出波束选择和用户配对的方法和装置

摘要

用于多用户(MU)多输入多输出(MIMO)用户配对选择的系统、方法、装置和计算机程序产品被提供。一种方法可以包括:使用(多个)深度神经网络(DNN)选择多用户多输入多输出(MU MIMO)候选波束,以及基于所选择的波束来选择配对用户。(多个)深度神经网络(DNN)被训练以使多用户优先级度量(MU‑PM)或多用户优先级度量(MU‑PM)的启发法达到最大限度。

著录项

说明书

技术领域

一些示例实施例总体上可以涉及移动或无线电信系统,诸如长期演进(LTE)或第五代(5G)无线电接入技术或新无线电(NR)接入技术、或其他通信系统。例如,某些实施例可以涉及这样的系统中的多用户(MU)多输入多输出(MIMO)用户配对。

背景技术

移动或无线电信系统的示例可以包括通用移动电信系统(UMTS)地面无线电接入网(UTRAN)、长期演进(LTE)演进型UTRAN(E-UTRAN)、高级LTE(LTE-A)、MulteFire、LTE-APro、和/或第五代(5G)无线电接入技术或新无线电(NR)接入技术。第五代(5G)或新无线电(NR)无线系统是指下一代(NG)无线电系统和网络架构。据估计,NR将提供10-20Gbit/s或更高量级的比特率,并且将至少支持增强型移动宽带(eMBB)和超可靠低时延通信(URLLC)以及大规模机器类型通信(mMTC)。预计NR将交付极度宽带和超鲁棒的低时延连接性以及大规模联网以支持物联网(IoT)。随着IoT和机器到机器(M2M)通信变得更加普遍,将存在对于满足更低功率、低数据速率和长电池寿命需求的网络的增长的需求。注意,在5G或NR中,可以向用户设备提供无线电接入功能的节点(即,类似于E-UTRAN中的节点B或LTE中的eNB)可以称为下一代或5G节点B(gNB)。

发明内容

一个实施例针对一种方法,该方法可以包括:使用(多个)深度神经网络(DNN)选择多用户多输入多输出(MU MIMO)候选波束,并且基于所选择的波束来选择配对用户。(多个)深度神经网络(DNN)被训练以使多用户优先级度量(MU-PM)或多用户优先级度量(MU-PM)的启发法达到最大限度。

另一实施例针对一种装置,该装置可以包括至少一个处理器和至少一个存储器,至少一个存储器包括计算机程序代码。至少一个存储器和计算机程序代码可以被配置为,与至少一个处理器一起,使该装置至少使用(多个)深度神经网络(DNN)选择多用户多输入多输出(MU MIMO)候选波束,并且基于所选择的波束来选择配对用户。(多个)深度神经网络(DNN)被训练以使多用户优先级度量(MU-PM)或多用户优先级度量(MU-PM)的启发法达到最大限度。

另一实施例针对一种装置,该装置可以包括:被配置为使用(多个)深度神经网络(DNN)选择多用户多输入多输出(MU MIMO)候选波束的电路系统、以及被配置为基于所选择的波束来选择配对用户的电路系统。(多个)深度神经网络(DNN)被训练以使多用户优先级度量(MU-PM)或多用户优先级度量(MU-PM)的启发法达到最大限度。

另一实施例针对一种装置,该装置可以包括:用于使用(多个)深度神经网络(DNN)选择多用户多输入多输出(MU MIMO)候选波束的部件、以及用于基于所选择的波束来选择配对用户的部件。(多个)深度神经网络(DNN)被训练以使多用户优先级度量(MU-PM)或多用户优先级度量(MU-PM)的启发法达到最大限度。

另一实施例针对一种非瞬态计算机可读介质,该非瞬态计算机可读介质包括存储在其上的程序指令,这些程序指令用于至少执行:使用(多个)深度神经网络(DNN)选择多用户多输入多输出(MU MIMO)候选波束,并且基于所选择的波束来选择配对用户。(多个)深度神经网络(DNN)被训练以使多用户优先级度量(MU-PM)或多用户优先级度量(MU-PM)的启发法达到最大限度。

在某些实施例中,候选波束的选择可以包括:由单级深度神经网络(DNN)波束选择器,通过深度神经网络(DNN)的单流程同时选择候选波束。

在一些实施例中,候选波束的选择可以包括:由多级深度神经网络(DNN)波束选择器针对每级一次选择一个波束。

在某些实施例中,该方法可以进一步包括:计算表示在调度时用户的相对优先级的用户优先级度量。在一些实施例中,该方法可以包括:至少使用用户优先级度量计算波束优先级度量。

在某些实施例中,该方法可以包括:对波束优先级度量执行数学变换,并且对变换后的波束优先级度量编码。在一些实施例中,该方法可以包括:使用编码后的波束优先级度量确定波束神经网络(NN)度量,这些波束神经网络(NN)度量表示以下至少一项:归一化的选择概率或贝尔曼方程的Q值。

在某些实施例中,候选波束的选择可以包括:基于波束神经网络(NN)度量选择至少一个波束。在一些实施例中,至少一个波束的选择可以包括:将波束神经网络(NN)度量与共同阈值进行比较,以在波束之中进行辨别。

在某些实施例中,至少一个波束的选择可以包括:根据波束神经网络(NN)度量对波束排序,并且从排序后的波束中选择前L个波束。在一些实施例中,候选波束的选择可以包括:基于波束神经网络(NN)度量选择零个或一个波束。

在某些实施例中,该方法还可以包括:在选择所述零个或一个波束之后,从在未来级的选择中,丢弃对所选择的所述零个或一个波束造成高交叉波束干扰的其他波束。在一些实施例中,该方法可以包括:基于终止标记的值确定是否前进到下一级以添加另一层。

在某些实施例中,该方法可以包括:通过选择标准,从候选波束选择之中确定最终波束选择。在一些实施例中,配对用户的选择可以包括:通过以下至少一项从最终波束选择中确定用户集合:丢弃未关联的用户或选择每个波束的最佳用户。根据一种实施例,该方法还可以包括:将最终波束选择、所选择的用户或用户对中的至少一项存储在易失性或非易失性存储器中。

在某些实施例中,候选波束的选择可以包括:使用(多个)深度神经网络(DNN)产生N个波束组合,并且从N个波束组合中选择产生最大效用的单个波束组合。

在一些实施例中,候选波束的选择可以包括:使用(多个)深度神经网络(DNN)产生N个波束组合,并且使用非DNN方法产生零个或更多波束组合,以及从N个波束组合和由非DNN方法产生的零个或更多组合之中选择产生最大效用的单个波束组合。

在某些实施例中,该方法还可以包括:利用训练样本训练(多个)深度神经网络(DNN),其中以下策略中的至少之一被用于创建训练样本:穷举搜索策略、多用户贪婪策略、无交叉波束干扰(CBI)贪婪策略、或随机贪婪混合策略。

附图说明

为了正确地理解示例实施例,应当参考附图,在附图中:

图1图示了根据一种实施例的使用深度学习的多用户MIMO用户配对系统的示例;

图2图示了根据一种实施例的示出了输入-输出的使用深度学习的多用户MIMO用户配对系统的示例;

图3图示了根据一种实施例的单级深度神经网络波束选择器的示例;

图4图示了根据一种实施例的单级深度神经网络波束选择器的全连接神经网络架构的示例;

图5图示了根据一种实施例的多级深度神经网络波束选择器的示例;

图6图示了根据一种实施例的多级深度神经网络波束选择器的全连接神经网络架构的示例;

图7图示了根据一种实施例的N深度Q网络(DQN)解决方案的示例框图;

图8图示了根据一种实施例的混合DQN解决方案(H-DQN)的示例框图;

图9图示了根据一种实施例的方法的示例流程图;以及

图10图示了根据一种实施例的装置的示例框图。

具体实施方式

将容易理解,如本文中的附图中总体上描述和图示的某些示例实施例的组件可以按照各种各样不同的配置来布置和设计。因此,例如使用深度学习的,用于多用户(MU)多输入多输出(MIMO)用户配对选择的系统、方法、装置和计算机程序产品的一些示例实施例的以下详细描述并非旨在限制某些实施例的范围,而是表示所选择的示例实施例。

贯穿本说明书中描述的示例实施例的特征、结构或特性可以在一个或多个示例实施例中以任何合适的方式组合。例如,贯穿本说明书中,对短语“某些实施例”、“一些实施例”或其他类似语言的使用是指以下事实:关于一种实施例描述的特定特征、结构或特性可以被包括在至少一个实施例中。因此,贯穿本说明书中短语“在某些实施例中”、“在一些实施例中”、“在其他实施例中”或其他类似语言的出现不是必然全都指代同一组实施例,并且所描述的特征、结构或特性可以在一个或多个示例实施例中以任何合适的方式组合。

另外,如果需要,下文论述的不同功能或步骤可以按照不同的顺序和/或彼此并发地执行。此外,如果需要,所描述的功能或步骤中的一个或多个可以是可选的或可以被组合。这样,以下描述应当被考虑为仅是对某些示例实施例的原理和教导的说明,而不是对其的限制。

在多用户MIMO(MU-MIMO)系统中,具有多个天线的基站(BS)可以与多个用户通信。典型地,BS在每个天线处放大和移动被传输或被接收的信号的相位,以便改进数据流的信号质量(即,分集组合),或者同时向一个或多个用户发送或接收多个数据流(即,空间复用)。这些天线处的信号的放大、相移和组合可以被认为是对信号施加“权重”集合,并且相对于天线取向而朝向某个空间方向形成“波束”。每个波束可以朝向一些方向增强相对接收/传输信号强度,同时朝向其他方向减小相对信号强度。

用于针对用户的波束的天线权重可以直接根据针对用户的时变信道估计来计算。这被称为基于非码本的波束赋形或预编码,其中波束的数目B等于用户的数目U。替代地,固定波束集合(即,波束网格(GoB))可以由BS用于所有传输或接收。这被称为基于码本的波束赋形或预编码。BS调度器在每个数据传输或接收时选择固定波束集合之中的哪个(哪些)波束对于每个用户是最佳的,其中来自用户的反馈可以帮助决定哪个(哪些)波束对于用户是最佳的。

在实践中,用户可以利用多个成对的准正交波束用于单个传输或接收突发,其中对一个波束的选择暗示对其他成对波束的选择。然而,为了简单,在本文中的一些实施例中,可以假定用户被关联到来自B个可用波束之中的单个波束。

对于每个时间-频率-码无线电资源单元(RU),BS可以同时调度L(L(1≤L≤L

MU-MIMO用户配对问题涉及在每个无线电资源处决定适当的波束集合和对应的用户集合。

MU-MIMO配对的目标是通过以下来使总效用最大化:在每个配对机会,在每个无线电资源处,使其梯度(称为多用户优先级度量MU-PM)最大化。

从B个波束的可能性中选择L个层而使总调度器度量最大化是困难的组合问题。例如,从32个波束中选择4个波束需要>3万个选择,而从64个波束中选择8个波束需要>40亿个选择。

由于评估MU-PM通常在时间方面或在存储器方面在计算上是昂贵的,并且选择的搜索空间可能非常大,因此执行组合搜索对于实时应用可能不可行。另一方面,计算上较不昂贵的启发法可能在计算上简单,但是提供与最优选择相比大为表现不佳的选择。因此,需要一种用于实时应用的在计算上相对不昂贵的MU-MIMO配对方案,其可以表现得尽可能地接近于最优选择的表现。本文中描述的示例实施例至少解决了这些问题。

某些实施例提供了一种方法和装置,它们利用执行配对用户的选择的一个或多个深度神经网络(DNN)。注意,如本文中使用的,深度学习可以指代对DNN的使用。代替通过启发式方案或组合方案直接执行候选波束选择的MU-PM计算和搜索,一个实施例使用DNN来执行波束选择。配对用户然后可以基于所选择的波束被选取。每个深度神经网络(DNN)可以接受用于计算优先级度量(PM)的量作为输入,并且被训练以使MU-PM或MU-PM的启发法达到最大限度。由于DNN的并行架构和操作简单性,基于DNN的方案的实施例可以快速且高效地计算MU-MIMO波束选择和用户配对,其可以胜过常规的启发式方案和组合搜索方案。

某些实施例可以包括一个或多个操作框或单元,如图1的示例系统图所图示。如图1中描绘的,该系统可以包括用户优先级度量计算器110、波束优先级度量计算器120、(多个)DNN波束选择器125、(多个)非DNN波束选择器130、最佳波束选择评估器140、和/或用户选择器150。在图1的示例中,对该系统的输入可以包括用于计算PM的每用户的量,并且输出可以包括用户配对或剩余候选用户。注意,图1中和下文论述的图2-图8中图示的框中的一个或多个框可以包括用于执行其功能的电路系统。

在一种实施例中,DNN波束选择器125可以有两种类型:单级DNN波束选择器和/或多级DNN波束选择器。在单级DNN波束选择器中,被调度的波束通过DNN的单流程同时被选择。在多级DNN波束选择器中,每级具有DNN,该DNN一次选择一个波束。该选择问题是动态程序。

对于任一种情况,DNN输入是波束优先级度量(或波束优先级度量的变换),并且它们的输出是归一化的选择概率P或贝尔曼方程的Q值,其中Q表示在给定状态下针对该波束的潜在增量式MU-PM。当Q值被输出时,则DNN也称为深度Q网络(DQN)。

图2图示了系统的示例实施例,其包括如上文介绍的用户优先级度量计算器110。用户优先级度量(UPM)向调度器通知在调度时用户的相对优先级。作为示例,如果仅一个用户可以针对资源被选择,则当用户A具有相比于用户B的更高UPM值时,用户A将被选择而非用户B。例如,根据以下方程,针对第u用户的

QoS度量将非吞吐量标准(诸如业务类别分组优先级、延迟目标优先级、用户类别、重传索引优先级、信令/控制优先级等)作为因素计入UPM中。TCBI(α)是交叉波束干扰(CBI)的总接收功率与用户的(多个)波束的功率之比。对于在RU处使用第i波束的用户(其中存在其他波束同时使用该RU),TCBI被给出为:

其中{\i}表示与第i波束共同调度的波束集合的索引j≠i。

如果用户CSI表示(或估计)在没有交叉波束干扰(α=0)的情况下针对用户的信干噪比(SINR),则它被称为单用户SINR(SU-SINR),标示为χ

多用户

其中功率拆分因子ψ

最终,在MU-MIMO下的用户吞吐量是MU-SINR的函数,并且UPM也是:

基于调度器策略的一些常用的UPM定义可以包括:比例公平调度器,例如由下式给出:

其中

信道感知相等吞吐量调度器例如由下式给出:

最大吞吐量调度器例如由下式给出:

图2的示例系统还可以包括波束优先级度量计算器120。概念上,波束优先级类似于用户优先级在于,如果单个波束可以针对RU被选择,那么如果第i波束的波束优先级度量(BPM)大于第j波束的BPM,则第i波束优于第j波束被选择。由于多个用户可以被关联到同一波束,因此波束选择可以作为用于用户选择的中间步骤来执行,以减少问题的维度(即,简化该问题)。首先,用户可以被分组到波束中,然后波束被选择,并且然后被关联至这些波束的用户被选择。BPM可以针对以下各项的每个组合被计算:波束ID b=1,…,B;TCBI的样本α=α

如果单个用户将针对波束被选择,则针对该波束的效用最大化的用户选择是选择具有最高UPM的相关联的用户,并且BPM如下:

其中W是为波束而分配的RU的总数,并且b

在某些场景中,诸如在突发性业务下,可能可取的是选择在波束上同时调度的多个用户,其中这些用户共享用户层内的正交RU。在这种情况下,BPM是UPM的和,其中每个UPM是基于针对其波束的用户的RU份额(w

其中0≤w

根据某些实施例,一个或多个DNN波束选择器125结合零个或更多非DNN波束选择器130,可以用来确定候选波束选择。如上文提到的,在一些实施例中,可以存在DNN波束选择器的两种架构,单级波束选择器和多级波束选择器。

图3图示了描绘根据一种实施例的单级DNN波束选择器(SSDBS)的示例的框图。如图3的示例中图示的,SSDBS可以由三个操作框组成:特征变换器和编码器(FTE)310、SSDBS深度神经网络320和多波束辨别器(MBD)330。

在该示例中,FTE框310可以对BPM输入执行数学变换,这些数学变换可以包括以下中的一项或多项:缩放、平移、对数、指数、逆变、校正、压缩等。变换后的BPM然后可以被编码以用作DNN输入(例如,独热编码器、矩阵到向量重整形器等)。变换和编码是可选的并且可以留给实施细节。

SSDBS DNN 320可以输出波束神经网络(NN)度量(y

SSDBS DNN 320的架构的示例可以包括全连接NN、卷积NN(CNN)、递归NN等。图4图示了全连接NN情况的示例,其中节点是神经元并且箭头是神经元之间的连接。每个神经元对其输入执行线性或可微分非线性变换,并且每个连接线性地缩放其输入。

MBD 330可以执行从DNN 320的输出中对一个或多个波束的选择。MBD 330可以确保层秩(被调度的层的数目)是有效的:1≤L≤Λ,并且每个被选择的波束具有至少一个相关联的用户。辨别可以是基于阈值的,或者基于Top-N。

例如,基于阈值的辨别可以将DNN 320的输出与共同阈值进行比较,以在波束之中进行辨别。令d

例如,top-L辨别可以根据DNN 320的输出以降序对波束排序。它然后可以从排序后的波束列表中选择前L个波束。如果层秩概率由DNN 320提供,则L=argmax

图5图示了描绘根据一种实施例的多级DNN波束选择器(MSDBS)的示例的框图。MSDBS可以迭代地选择波束,其中每级基于在前级的已经选择的波束来选择一个波束。继续到下一级取决于DNN输出。

如图5的示例中图示的,MSDBS可以由四个操作框组成:特征变换器和编码器(FTE)510、MSDBS DNN 520、单波束辨别器(SBD)530和终止器540。

FTE框510可以对BPM输入执行数学变换,这些数学变换可以包括以下中的一项或多项:缩放、平移、对数、指数、逆变、校正、压缩等。变换后的BPM然后可以被编码以用作DNN输入(例如,独热编码器、矩阵到向量重整形器等)。变换和编码是可选的并且可以留给酌情决定。

与SSDBS的DNN相似,MSDBS DNN 520可以输出波束NN度量(y

图6图示了根据一种实施例的MSDBS全连接NN情况的示例。在图6的示例中,节点是神经元并且箭头是连接。在图6的模型中,先前选择的波束的集合{b

SBD 530可以执行从DNN输出中对单个波束的选择或不选择波束。SBD 530可以确保层秩是有效的:l≤Λ,并且所选择的波束具有至少一个相关联的用户。可选地,在单个波束的选择之后,对所选择的波束造成高交叉波束干扰的波束(也称为附近波束)可以通过在未来级中将它们的BPM清零或通过替代手段,而在未来级从可能的选择中被丢弃。

如果波束的NN度量最大并且NN度量满足阈值,则该波束可以被选择。用于第b波束的波束选择指示符是

被标记的指示符为该级提供所选择的波束:

其中ε

一个示例终止条件是:当所有波束选择指示符都为零时,或当已经达到用户层的最大数目时:

终止器540可以基于终止标记的值来确定是否前进到下一级以添加另一层。当

根据某些实施例,BBSE 140可以用于经由任意选择标准,从由两个或更多波束选择器125、130提供的候选波束选择之中找到最终波束选择。

一个选择标准是将和PM(SPM)最大化的最大和优先级度量,其定义为:

其中α({\[l]})标示在第l层处其他共同调度的波束与该波束的TCBI,并且

用户选择器150可以通过丢弃未关联的用户或选择每个波束的最佳用户,从最终波束选择中确定用户集合。在一些使用情况下,调度器可以从最终波束选择中提供用户配对,其中存在单个用户针对波束被指配。对于这种情况,第l配对用户

如果PM最大化的用户针对每个波束被选择,则SPM等于波束选择的MU-PM。在其他使用情况下,诸如当多个用户可以针对波束同时被分配时,用户选择器简单地丢弃未关联的用户。令

最后,当

对于SSDBS和MSDBS,某些实施例可以实现被称为深度Q网络(DQN)的特定类别的神经网络。在训练这些网络时,它们产生的输出是Q值的集合:

方程(22)被称为贝尔曼方程,其中γ是未来折扣因子。它根据系统所处的状态s以及在状态s中采取的动作α来计算Q值。Q值表示在采取动作α时观察到的未来回报,并且其等于以下项之和:假定采取动作α的情况下系统将转变到的状态s'的立即回报r(s,a)和潜在最大未来回报max

在一种实施例中,状态s被定义为如下的矩阵:用于预定义的TCBI集合α=α

动作α对应于在状态s中选择第b波束,并且回报r是对于在状态s中选择第b波束的在SPM中的净增加:

在(24)中,第一项是针对先前选择的波束以及为第l用户层选择的第b波束的总和优先级度量。第二项是仅针对先前选择的波束的SPM。SPM在(17)中详细说明。

假定γ=1,从(23)和(24),我们发现Q表示通过添加第b波束而提供的潜在最大SPM,其条件是先前波束选择:

其中L≤Λ,并且{b

在DNN训练期间,MSDBS DNN或SSDBS DNN使用这些Q值作为目标输出:

r的特殊情况用于初始状态s

r(s

类似地,用于Q的特殊情况是在初始状态:

其表示假设第b波束被选择的情况下针对所有波束选择的最大SPM。因此,对于SPM最大化的波束选择的所有波束

通过公式(29),其DNN在初始状态下编码Q的SSDBS可以用于在单个步骤中确定SPM最大化波束的集合,因为它们的Q应当大于波束中的其余波束的Q。

替代地,为了在实际DNN下可能地增大选择精度,利用“一次一个波束”选择的基于MSDBS的波束辨别可以被执行。利用MSDBS,一个或多个DNN针对l=1,..,Λ来编码Q,并且SBD从其余部分中确定在第l层的Q最大化波束。

为了在(22)中获得最优Q函数,针对所有状态s和动作α的值迭代可以进行。该目标/最优Q函数然后可以使用机器学习方法(诸如DQN)来估计。在实践中,Q函数可以通过如下地同时进行值迭代和近似来获得/估计。

某些实施例可以定义状态s以包括如在(23)中公式化的先前选择的波束的列表,并且将其与BPM的有序列表一起用作训练DQN的输入。示例实施例可以将动作α定义为状态s中的波束选择b。在这种情况下,针对每个状态的Q值集合(DQN神经网络的目标输出)将对应于在状态s中选择波束b的最大的部分SPM(25)。

一种实施例提供了DQN神经网络训练样本生成。利用正确的训练样本来训练DQN网络可能是重要的。如果未被恰当地训练,则网络可能不会收敛到有用状态,并且网络的输出将不会产生由(22)定义的Q值。

若干策略可以用来创建训练样本。例如,这些策略可以包括穷举搜索策略、多用户贪婪策略、无CBI贪婪策略、或随机贪婪混合策略。在穷举搜索策略中,训练样本是使用产生如(18)中定义的BPM最大和的所有波束组合的穷举搜索来生成的。在多用户贪婪策略中,训练样本是通过查看状态s中的哪个动作α将产生最高回报r来生成的,其中r在(24)中定义。在无CBI贪婪策略中,假定在计算UPM时没有交叉波束干扰,训练样本是通过采取将使UPM之和最大化的动作来产生的。然而,来自已经选择的这些波束中具有高CBI的波束可以被丢弃。在随机贪婪混合策略中,前j个元组可以随机地被选择,随后是针对剩余用户层的贪婪方案,以将总组合保持在可管理的范围中。

一旦训练样本被生成,它们可以被划分为小批量,并且DQN利用这些小批量被增量训练。小批量的大小可以是可配置的。

图7图示了N-DQN解决方案的示例框图。在一些实施例中,多个DQN可以被训练,并且在这种情况下,使效用度量(例如,如(17)中定义的度量)最大化的输出可以被选择。以这种方式,跨多个DQN的分集可以通过以下来实现:DQN波束选择器710选择给出最佳波束组合的DQN的输出。最佳波束组合是使预定义的效用度量最大化的波束组合。这可以适用于单级和多级波束选择器神经网络实施方式两者。

图8图示了混合DQN解决方案(H-DQN)的示例框图。根据该实施例,常规获得的波束组合的输出可以与通过DQN或N-DQN解决方案810获得的输出进行组合。由于穷举搜索算法的计算复杂性,常规获得的波束组合通常是次优的。然而,神经网络可以被训练以模仿穷举搜索,并且获得将使预定义的效用度量最大化的波束组合。此外,将常规算法与DQN组合的益处是,它为DQN输出给出次优或不良波束组合时的情况提供了安全网。

图9图示了根据一个示例实施例的用于在MU-MIMO系统中选择配对用户的方法的示例流程图。在某些示例实施例中,图9的流程图可以由网络节点(诸如基站、节点B、eNB、gNB、或任何其他接入节点)或云配置中的一个或多个服务器来执行。某些实施例可以被配置为执行由上文详细论述的图1和图2的系统执行的方法。在一些实施例中,该方法可以包括:使用DNN选择MU-MIMO候选波束,并且基于所选择的候选波束来选择配对用户。在一种实施例中,DNN可以被训练以使MU-PM或MU-PM的启发法达到最大限度。

更具体地,如图9的示例中图示的,该方法可以包括:在900处,计算表示在调度时用户的相对优先级的UPM。在某些实施例中,针对第u用户的

在一种实施例中,该方法然后可以包括:在910处,至少使用UPM来计算BPM。根据一些实施例,计算910可以包括针对以下各项的每个组合计算BPM:波束ID b=1,…,B,TCBI的样本α=α

根据某些实施例,该方法还可以包括:在920处,对BPM执行数学变换并且对变换后的BPM编码。例如,数学变换可以包括缩放、平移、对数、指数、逆变、校正、压缩等中的一项或多项。作为示例,编码可以包括独热编码、矩阵到向量重整形等。该方法然后可以包括:在930处,使用编码后的波束优先级度量来确定波束NN度量,这些波束NN度量表示以下至少一项:归一化选择概率和/或贝尔曼方程的Q值。可选地,该方法可以包括:确定层秩度量概率以指示应当被选择的用户层的数目。在一些实施例中,该方法可以进一步包括:在940处,使用DNN来选择候选波束。根据某些实施例,DNN可以包括全连接NN、卷积NN、递归NN等。

根据一种实施例,选择940可以包括:基于波束NN度量来选择至少一个波束。例如,在一个实施例中,选择940可以包括:由单级DNN波束选择器通过DNN的单流程同时选择候选波束。在某些实施例中,至少一个波束的选择可以包括:将波束NN度量与共同阈值进行比较,以在波束之中进行辨别。例如,d

在其他实施例中,至少一个波束的选择可以包括:根据波束NN度量对波束排序,并且从排序后的波束的列表中选择前L个波束。在一种实施例中,当层秩概率被提供时,那么L=argmax

根据另一实施例,选择940可以包括:基于波束NN度量来选择零个或一个波束。例如,在一个实施例中,选择940可以包括:由多级DNN波束选择器针对每级一次选择一个波束。在一些实施例中,在选择零个或一个波束之后,从在未来级的选择中丢弃对所选择的零个或一个波束造成高交叉波束干扰的其他波束。在一些实施例中,选择940可以包括:如果波束的NN度量最大并且NN度量满足阈值,则选择该波束。

根据一种实施例,该方法还可以包括:基于终止标记的值来确定是否前进到下一级以添加另一层。此外,在一些实施例中,选择940可以包括:确保层秩是有效的并且所选择的波束具有至少一个相关联的用户。

在某些实施例中,该方法可以包括:在950处,通过选择标准,从候选波束选择之中确定最终波束选择。例如,选择标准可以包括使和PM(SPM)最大化的最大和优先级度量,其定义为:

其中α({\[l]})标示在第l层处其他共同调度的波束与该波束的TCBI,并且

根据一种实施例,该方法可以包括:在960处,基于最终波束选择来选择配对用户。在一个实施例中,选择960可以包括:通过以下至少一项从最终波束选择中确定用户集合:丢弃未关联的用户,或选择每个波束的最佳用户。在某些实施例中,当来自最终波束选择的用户配对被提供,并且存在针对所选择的波束指配的单个用户时,第l配对用户

在这种情况下,选择960可以包括:针对每个波束选择PM最大化用户,并且那么SPM等于波束选择的MU-PM。在其他示例中,诸如当多个用户可以针对波束同时被分配时,选择960可以包括:丢弃未关联的用户。该方法还可以包括:调度所选择的(多个)用户。在一种实施例中,如果

那么,选择960可以包括:当

图10图示了根据一种示例实施例的装置10的示例。在示例实施例中,装置10可以是通信网络中的或服务于这样的网络的节点、主机、或服务器。例如,装置10可以是与无线电接入网络(诸如LTE网络、5G或NR或可能受益于等效过程的其他无线电系统)相关联的基站、节点B、演进型节点B(eNB)、5G节点B或接入点、下一代节点B(NG-NB或gNB)、WLAN接入点、移动性管理实体(MME)、和/或订阅服务器。

应当理解,在一些示例实施例中,装置10可以包括作为分布式计算系统的边缘云服务器,在分布式计算系统中,服务器和无线电节点可以是经由无线电路径或经由有线连接而彼此通信的独立装置,或者它们可以位于同一实体中经由有线连接而通信。例如,在装置10表示gNB的某些示例实施例中,它可以被配置在划分gNB功能的中央单元(CU)和分布式单元(DU)架构中。在这样的架构中,CU可以是包括gNB功能(诸如用户数据的传送、移动性控制、无线电接入网络共享、定位、和/或会话管理等)的逻辑节点。CU可以通过前传接口来控制(多个)DU的操作。取决于功能拆分选项,DU可以是包括gNB功能的子集的逻辑节点。应当注意,本领域的普通技术人员将理解,装置10可以包括图10中未示出的组件或特征。

如图10的示例中图示的,装置10可以包括用于处理信息并且执行指令或操作的处理器12。处理器12可以是任何类型的通用或专用处理器。实际上,作为示例,处理器12可以包括以下一项或多项:通用计算机、专用计算机、微处理器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、以及基于多核处理器架构的处理器。虽然在图10中示出了单个处理器12,但是根据其他示例实施例,可以利用多个处理器。例如,应当理解,在某些示例实施例中,装置10可以包括两个或更多处理器,两个或更多处理器可以形成多处理器系统(例如,在这种情况下,处理器12可以表示多处理器),多处理器系统可以支持多处理。在某些示例实施例中,多处理器系统可以紧密地耦合或松散地耦合(例如,以形成计算机集群)。

处理器12可以执行与装置10的操作相关联的功能,其可以包括例如天线增益/相位参数的预编码、形成通信消息的各个比特的编码和解码、信息的格式化、以及对装置10的整体控制,包括与通信资源的管理有关的过程。

装置10可以进一步包括或耦合到至少一个存储器14(内部或外部),其可以耦合到处理器12,用于存储信息和可以由处理器12执行的指令。存储器14可以是一个或多个存储器并且具有适合于本地应用环境的任何类型,并且可以使用任何合适的易失性或非易失性数据存储技术来实现,诸如基于半导体的存储器设备、磁存储器设备和系统、光存储器设备和系统、固定存储器、和/或可移除存储器。例如,存储器14可以包括以下项的任何组合:随机存取存储器(RAM)54、只读存储器(ROM)44、非易失性存储器、诸如磁盘或光盘等静态存储装置、硬盘驱动器(HDD)、或任何其他类型的非瞬态机器或计算机可读介质。例如,在一种实施例中,装置10可以包括非易失性介质64。在一种实施例中,非易失性介质64可以是可移除介质。存储器14和/或介质64可以存储软件、计算机程序代码、或指令。存储器14或介质64中存储的指令可以包括程序指令或计算机程序代码,其在由处理器12执行时,使得装置10能够执行本文中描述的任务。

在一种示例实施例中,装置10可以进一步包括或耦合到(内部或外部)驱动器或端口,该驱动器或端口被配置为接受和读取外部计算机可读存储介质,诸如光盘、USB驱动器、闪存驱动器、或任何其他存储介质。例如,外部计算机可读存储介质可以存储用于由处理器12和/或装置10执行的计算机程序或软件。

在一些示例实施例中,装置10还可以包括或耦合到一个或多个天线15,以用于向装置10传输信号和/或数据以及从装置10接收信号和/或数据。装置10可以进一步包括或耦合到被配置为传输和接收信息的收发器18。收发器18可以包括例如可以耦合到(多个)天线15的多个无线电接口。这些无线电接口可以对应于多种无线电接入技术,包括以下中的一项或多项:GSM、NB-IoT、LTE、5G、WLAN、BT-LE、射频标识符(RFID)、超宽带(UWB)、MulteFire等。无线电接口可以包括诸如滤波器、转换器(例如,数模转换器等)、映射器、快速傅立叶变换(FFT)模块等组件,以生成用于经由一个或多个下行链路的传输的符号并且接收符号(例如,经由上行链路)。收发器18可以包括用于对RF信号下变频和/或上变频的一个或多个RF链,例如包括双工器、前端RF放大器、混频器、滤波器、压控振荡器等,它们中的一部分或全部的激活可以根据示例实施例被激活。

这样,收发器18可以被配置为将信息调制到载波波形上以用于通过(多个)天线15的传输,并且解调经由(多个)天线15接收的信息以用于由装置10的其他元件的进一步处理。在其他示例实施例中,收发器18可以能够直接传输和接收信号或数据。另外地或替代地,在一些示例实施例中,装置10可以包括输入和/或输出设备(I/O设备)。

在一种示例实施例中,存储器14可以存储在由处理器12执行时提供功能的软件模块。这些模块可以包括,例如,为装置10提供操作系统功能的操作系统。存储器还可以存储为装置10提供附加功能的一个或多个功能模块,诸如应用或程序。装置10的组件可以被实施在硬件中,或实施为硬件和软件的任何合适的组合。

根据一些示例实施例,处理器12和存储器14可以被包括在处理电路系统或控制电路系统中,或者可以形成处理电路系统或控制电路系统的一部分。另外,在一些示例实施例中,收发器18可以被包括在收发电路系统中,或者可以形成收发电路系统的一部分。

如本文中使用的,术语“电路系统”可以是指仅硬件电路系统实现(例如,模拟和/或数字电路系统)、硬件电路和软件的组合、模拟和/或数字硬件电路与软件/固件的组合、一起工作以使装置(例如,装置10)执行各种功能的具有软件的(多个)硬件处理器(包括数字信号处理器)的任何部分、和/或(多个)硬件电路和/或(多个)处理器、或它们的部分,其使用软件用于操作,但是在操作不需要软件时可以不存在软件。作为另外的示例,如本文中使用的,术语“电路系统”还可以覆盖仅硬件电路或处理器(或多个处理器)、或硬件电路或处理器的一部分、及其随附的软件和/或固件的实现。术语电路系统还可以覆盖例如服务器、蜂窝网络节点或设备、或其他计算或网络设备中的基带集成电路。

如上文介绍的,在示例实施例中,装置10可以是网络节点或RAN节点,诸如基站、接入点、节点B、eNB、gNB、WLAN接入点等。根据示例实施例,装置10可以由存储器14和处理器12控制,以执行与本文中描述的示例实施例中的任何示例实施例相关联的功能,诸如图9中图示的流程图。另外,在某些实施例中,装置10可以包括或实现图1-图8中图示的系统。在示例实施例中,例如,装置10可以被配置为执行用于在MU-MIMO系统中选择配对用户的过程。

例如,在一些示例实施例中,装置10可以由存储器14和处理器12控制为:使用DNN选择MU-MIMO候选波束,并且基于所选择的候选波束来选择配对用户。在一种实施例中,DNN可以被训练以使MU-PM或MU-PM的启发法达到最大限度。

更具体地,在一种实施例中,装置10可以由存储器14和处理器12控制为计算表示在调度时用户的相对优先级的UPM。在某些实施例中,针对第u用户的

在一种实施例中,装置10可以由存储器14和处理器12控制为至少使用UPM来计算BPM。根据一些实施例,装置10可以由存储器14和处理器12控制为针对以下各项的每个组合计算BPM:波束ID b=1,…,B,TCBI的样本α=α

根据某些实施例,装置10可以由存储器14和处理器12控制为对BPM执行数学变换并且对变换后的BPM编码。在一种实施例中,装置10可以由存储器14和处理器12控制为使用编码后的波束优先级度量来确定波束NN度量,这些波束NN度量表示以下至少一项:归一化选择概率和/或贝尔曼方程的Q值。可选地,装置10可以由存储器14和处理器12控制为确定层秩度量概率,以指示应当被选择的用户层的数目。在一些实施例中,装置10可以由存储器14和处理器12控制为使用DNN来选择候选波束。根据某些实施例,DNN可以包括全连接NN、卷积NN、递归NN等。

根据一种实施例,装置10可以由存储器14和处理器12控制为基于波束NN度量来选择至少一个波束。例如,在一个实施例中,装置10可以由存储器14和处理器12控制为通过DNN的单流程同时选择候选波束。在某些实施例中,装置10可以由存储器14和处理器12控制为将波束NN度量与共同阈值进行比较,以在波束之中进行辨别。例如,d

在其他实施例中,装置10可以由存储器14和处理器12控制为:根据波束NN度量对波束排序以形成波束的有序列表,并且从排序后的波束的列表中选择前L个波束。在一种实施例中,当层秩概率被提供时,那么L=argmax

根据另一实施例,装置10可以由存储器14和处理器12控制为基于波束NN度量来选择零个或一个波束。例如,在一个实施例中,装置10可以由存储器14和处理器12控制为针对每级一次选择一个波束。在一些实施例中,在选择零个或一个波束之后,装置10可以由存储器14和处理器12控制为:从在未来级的选择中丢弃对所选择的零个或一个波束造成高交叉波束干扰的其他波束。在一些实施例中,装置10可以由存储器14和处理器12控制为:如果波束的NN度量最大并且NN度量满足阈值,则选择该波束。

根据一种实施例,装置10可以由存储器14和处理器12控制为:基于终止标记的值来确定是否前进到下一级以添加另一层。此外,在一些实施例中,装置10可以由存储器14和处理器12控制为:确保层秩是有效的并且所选择的波束具有至少一个相关联的用户。

在某些实施例中,装置10可以由存储器14和处理器12控制为:通过选择标准从候选波束选择中确定最终波束选择。例如,选择标准可以包括使和PM(SPM)最大化的最大和优先级度量,如上文论述的公式(18)中定义的。最终波束选择可以是使SPM最大化的选择,如上文论述的公式(19)中定义的。

根据一种实施例,装置10可以由存储器14和处理器12控制为基于最终波束选择来选择配对用户。在一个实施例中,装置10可以由存储器14和处理器12控制为:通过丢弃未关联的用户或选择每个波束的最佳用户中的至少一项,从最终波束选择中确定用户集合。在某些实施例中,装置10可以由存储器14和处理器12控制为针对每个波束选择PM最大化的用户。在其他示例中,诸如当多个用户可以针对波束同时被分配时,装置10可以由存储器14和处理器12控制为丢弃未关联的用户。在一种实施例中,装置10可以由存储器14和处理器12控制为基于上文论述的方程(21)的结果来选择用户用于调度。根据某些实施例,装置10可以由存储器14和处理器12控制为调度所选择的(多个)用户。在一些实施例中,装置10可以由存储器14和处理器12控制为:将最终波束选择、所选择的用户和/或用户对中的一项或多项存储在例如易失性或非易失性存储器中。在一种实施例中,装置10可以由存储器14和处理器12控制为:在最终波束选择上和/或向所选择的(多个)用户对进行传输。

因此,某些示例实施例提供了若干技术改进、增强和/或优点。例如,某些实施例提供了方法来快速且高效地计算MU-MIMO波束选择和用户配对,这些方法可以胜过常规的启发式和组合搜索方案。这样,示例实施例可以改进网络和网络节点(包括例如接入点、基站/eNB/gNB、以及移动设备或UE)的性能、时延和/或吞吐量。因此,某些示例实施例的使用导致通信网络和它们的节点的改进的功能。

在一些示例实施例中,本文中描述的方法、过程、信令图、算法或流程图中的任何项的功能可以通过以下来实现:在存储器或其他计算机可读或有形介质中存储并且由处理器执行的软件和/或计算机程序代码或代码部分。

在一些示例实施例中,一种装置可以被包括在或关联于至少一个软件应用、模块、单元或实体,该软件应用、模块、单元或实体被配置为由至少一个操作处理器执行的(多个)算术运算、或其程序或部分(包括添加或更新的软件例程)。程序,也称为程序产品或计算机程序,包括软件例程、小应用和宏指令,可以存储在任何装置可读数据存储介质中,并且包括执行特定任务的程序指令。

一种计算机程序产品可以包括一个或多个计算机可执行组件,当程序被运行时,计算机可执行组件被配置为执行一些示例实施例。一个或多个计算机可执行组件可以是至少一个软件代码或其部分。用于实现示例实施例的功能所需要的修改和配置可以作为(多个)例程来执行,(多个)例程可以被实施为添加或更新的(多个)软件例程。(多个)软件例程可以被下载到装置中。

作为示例,软件或计算机程序代码或其部分可以是源代码形式、目标代码形式、或某种中间形式,并且其可以存储在某种载体、分发介质、或计算机可读介质中,这些载体或介质可以是能够承载程序的任何实体或设备。这样的载体可以包括例如记录介质、计算机存储器、只读存储器、光电和/或电载波信号、电信信号、和软件分发包。取决于所需要的处理能力,计算机程序可以在单个电子数字计算机中执行,也它可以被分布在多个计算机之中。计算机可读介质或计算机可读存储介质可以是非瞬态介质。

在其他示例实施例中,功能可以由装置(例如,装置10)中包括的硬件或电路系统来执行,例如通过使用专用集成电路(ASIC)、可编程门阵列(PGA)、现场可编程门阵列(FPGA)、或硬件和软件的任何其他组合。在又另一示例实施例中,功能可以被实现为信号,无形手段,其可以由从互联网或其他网络下载的电磁信号来承载。

根据一种示例实施例,装置(诸如节点、设备、或对应组件)可以被配置为电路系统、计算机或微处理器(诸如单芯片计算机元件),或被配置为芯片组,至少包括存储器和运算处理器,存储器用于提供用于算术运算的存储容量,运算处理器用于执行算术运算。

本领域的普通技术人员将容易理解,如上文论述的示例实施例可以利用与所公开的相比不同顺序的步骤,和/或利用不同配置中的硬件元件来实践。因此,尽管已经基于这些示例性优选实施例描述了一些实施例,但是对本领域的技术人员清楚的是,某些修改、变化和替代构造将是清楚的,同时仍然在示例实施例的精神和范围内。因此,为了确定示例实施例的边界和范围,应当参考所附的权利要求。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号