首页> 中国专利> 多变量数据混合模型估计装置、混合模型估计方法和混合模型估计程序

多变量数据混合模型估计装置、混合模型估计方法和混合模型估计程序

摘要

关于混合模型的模型选择问题,本发明关于模型候选的数目,基于适当的标准执行高速模型选择,所述模型候选的数目随着要混合的数目和类型的增多呈指数增大。一种混合模型估计装置包括:数据输入单元,所述数据输入单元输入要估计的混合模型的数据、估计数据的混合模型所需的混合数目的候选值、以及配置混合模型的分量的类型和参数;处理单元,所述处理单元根据候选值设置混合数目,针对设置的混合数目来计算针对随机变量的隐变量的变异概率,所述随机变量是数据的混合模型估计的目标,并通过使用计算的隐变量的变异概率优化分量的类型及其参数以便最大化针对混合模型的每个分量分离的模型后验概率的下限,来估计优化混合模型;以及模型估计结果输出单元,所述模型估计结果输出单元输出由处理单元获得的模型估计结果。

著录项

  • 公开/公告号CN103221945A

    专利类型发明专利

  • 公开/公告日2013-07-24

    原文格式PDF

  • 申请/专利权人 日本电气株式会社;

    申请/专利号CN201280003749.0

  • 发明设计人 藤卷辽平;森永聪;

    申请日2012-03-16

  • 分类号G06F17/18;

  • 代理机构中科专利商标代理有限责任公司;

  • 代理人倪斌

  • 地址 日本东京都

  • 入库时间 2024-02-19 20:03:36

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-09-14

    授权

    授权

  • 2013-08-21

    实质审查的生效 IPC(主分类):G06F17/18 申请日:20120316

    实质审查的生效

  • 2013-07-24

    公开

    公开

说明书

技术领域

本发明涉及多变量数据混合模型估计装置、混合模型估计方法和混 合模型估计程序,更具体地,涉及用于估计要混合的模型的数目、类型 和参数的多变量数据混合模型估计装置、混合模型估计方法和混合模型 估计程序。

背景技术

使用多个模型来呈现数据的混合模型(混合分布)在工业应用中非 常重要。存在多种示例,例如混合正态分布模型和混合隐马尔可夫模型。 例如,工业上这种混合模型用于根据观测到的异常值发现不诚实的医疗 账单(非专利文献1),或检测网络故障(非专利文献2)。此外,混合模 型的其他重要应用示例包括销售中消费者行为聚类(基于假定类似消费 者属于相同模型的研究)以及对物品主题的分析(基于相同主题的物品 属于相同模型的研究)。

通常,在指定构成混合模型的多个模型(也称作分量)的混合的数 目(也称混合数目)和分量类型的情况下,例如EM算法(非专利文献 3)和变分贝叶斯方法(非专利文献4)之类的公知方法可以用于指定分 布(模型)的参数。确定用于估计这种参数的混合数目和分量类型是必 要的。通常,指定这种模型的问题被称作“模型选择问题”或“系统识 别问题”,并认为是构建可靠模型的重要问题。因此,已经提出了有关该 问题的多种技术。

例如,选择具有最大后验概率的模型的方法被称作用于确定要混合 的模型的数目的方法。为此提出的方法有:1)基于贝叶斯信息量的方法; 2)基于变分贝叶斯方法的方法(例如,非专利文献4);3)基于使用 Dirichlet过程的非参数化贝叶斯估计的方法(例如,非专利文献5);等。

现有技术列表:

非专利文献

非专利文献1:Kenji Yamanishi,Jun-ichi Takeuchi,Graham Williams, and Peter Milne,″Online Unsupervised Outlier Detection Using Finite Mixtures with Discounting Learning Algorithms″,Proceedings of the Sixth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining(KDD2000),ACM Press,2000,pp.320-324。

非专利文献2:Kenji Yamanishi,and Yuko Maruyama,″Dynamic Syslog Mining for Network Failure Monitoring″,Proceedings of the Eleventh ACM SIGKDD International Conference on Knowledge Discovery and Data Mining(KDD2005),ACM Press,2005,pp.499-508。

非专利文献3:A.P.Dempster,N.M.Laird,and D.B.Rubin,″Maximum Likelihood from Incomplete Data via the EM Algorithm″,Journal of Royal Statical Society.Series B(Methodological),Vol.39,No.1,1977,pp.1-38。

非专利文献4:Adrian Corduneanu and Christopher M.Bishop, ″Variational Bayesian Model Selection for Mixture Distributions″,In Artificial Intelligence and Statistics2001,T.Jaakkola and T.Richardson (eds.),Morgan Kaufmann,pp.27-34。

非专利文献5:Carl Edward Rasmussen,″The Infinite Gaussian Mixture Model″,in Advances in Neural Information Processing Systems12,S.A. Solla,T.K.Leen and K.-R.Muller(eds.),MIT Press(2000),pp.554-560.

非专利文献6:Ryohei Fujimaki,Satoshi Morinaga,Michinari Monmma, Kenji Aoki and Takayuki Nakata,″Linear Time Model Selection for Mixture of Heterogeneous Components″,Proceedings of the 1st Asian Conference on Machine Learning,2009。

发明内容

技术问题

根据方法1),可以在不建立模型的先验分布的假设下进行模型选 择。然而,在这种情况下,混合模型的Fischer信息矩阵变为非正则,因 此不能正确地定义准则并且不能选择恰当的混合数目。

根据方法2)和3),使用Direchlet分布和Direchlet过程作为混合比 的先验分布来确定混合数目。然而,在这种情况下,与其中选择产生高 模型后验概率的模型的常规方法相比较,难以选择优化的混合数目。

此外,根据方法1)到3),实际中由于计算量导致不可能优化要混 合的模型的类型。作为算出计算量的示例,现在解释混合多项式曲线的 选择。

多项式曲线包括一阶到高阶项,例如线性项(一阶曲线项)、二阶曲 线项和三阶曲线项。因此,如果根据上述方法,在搜索从1到Cmax的混 合数目和从第一到Dmax的曲线阶数之后选择优化模型,则必须针对所有 模型候选计算信息准则:一条直线和两条二阶曲线(混合数目=3)、三 条三阶曲线和两条四阶曲线(混合数目=5)等。例如,如果Cmax=10且 Dmax=10,则模型候选的数目大约是100000,如果Cmax=20且Dmax=20, 则模型候选的数目大约是100亿,要搜索的每个模型候选的复杂度呈指 数增长。

除了上述方法以外,还提出了根据其他模型选择准则(例如Akaike 信息准则和交叉验证)的方法。然而,任何方法都不能避免分量类型的 组合。

非专利文献6提出了一种最小化隐变量的期望值信息准则的方法, 以便有效地搜索要混合的模型的数目和类型,其中隐变量具有最小描述 长度,该期望值信息准则被认为等同于贝叶斯信息准则。然而,在该方 法中,由于与方法1)相同的原因,混合模型的Fischer信息矩阵是非正 则的,因此准则本身是不正确的,不可能进行优化模型选择。

本发明的目的是解决该问题并提供一种混合模型估计装置、混合模 型估计方法和混合模型估计程序,其中针对混合模型的模型选择问题, 可以关于模型候选的数目,根据适当准则快速地进行模型选择,所述模 型候选的数目随着要混合的数目和类型的增多呈指数增大。

解决问题的技术方案

本发明的第一方面提供了一种混合模型估计装置,包括:数据输入 单元,所述数据输入单元输入要估计的混合模型的数据和估计所述数据 的所述混合模型必需的混合数目的候选值以及构成所述混合模型的分量 的类型和所述分量的参数;处理单元,所述处理单元根据所述候选值设 置所述混合数目,相对于设置的所述混合数目来计算针对随机变量的隐 变量的变异概率,所述随机变量是估计所述数据的所述混合模型的目标, 并通过使用计算的所述隐变量的所述变异概率优化所述分量的所述类型 和所述参数以便最大化针对所述混合模型的每个所述分量分离的模型后 验概率的下限,来优化地估计所述混合模型;以及模型估计结果输出单 元,所述模型估计结果输出单元输出由所述处理单元获得的模型估计结 果。

本发明的第二方面提供了一种混合模型估计方法,包括:通过使用 输入单元,输入要估计的混合模型的数据和估计所述数据的所述混合模 型必需的混合数目的候选值以及构成所述混合模型的分量的类型和所述 分量的参数;使处理单元根据所述候选值设置所述混合数目,计算针对 随机变量的隐变量的变异概率,所述随机变量是估计所述数据的所述混 合模型的目标,并通过使用计算的所述隐变量的变异概率优化所述分量 的所述类型和所述参数以便最大化针对所述混合模型的每个所述分量分 离的模型后验概率的下限,来优化地估计所述混合模型;以及使模型估 计结果输出单元输出由所述处理单元获得的模型估计结果。

本发明的第三方面提供了一种混合模型估计程序,用于将计算机操 作为一种混合模型估计装置,所述混合模型估计装置包括:数据输入单 元,所述数据输入单元输入要估计的混合模型的数据和估计所述数据的 所述混合模型必需的混合数目的候选值以及构成所述混合模型的分量的 类型和所述分量的参数;处理单元,所述处理单元根据所述候选值设置 所述混合数目,相对于设置的所述混合数目来计算针对随机变量的隐变 量的变异概率,所述随机变量是估计所述数据的所述混合模型的目标, 并通过使用计算的所述隐变量的所述变异概率优化所述分量的所述类型 和所述参数以便最大化针对所述混合模型的每个所述分量分离的模型后 验概率的下限,来优化地估计所述混合模型;以及模型估计结果输出单 元,所述模型估计结果输出单元输出由所述处理单元获得的模型估计结 果。

本发明的有益效果

根据本发明,针对混合模型的模型选择问题,可以关于模型候选的 数目,根据适当准则快速地进行模型选择,所述模型候选的数目随着要 混合的数目和类型的增多呈指数增大。

附图说明

[图1]示出了根据本发明实施例用于演示混合模型估计装置的结构 的方框图。

[图2]示出了用于演示根据图1所示混合模型估计装置的操作的流 程图。

具体实施方式

下文中将参考附图来详细描述根据本发明实施例的混合模型估计装 置、混合模型估计方法和混合模型估计程序。

本发明的实施例提出了一种用于估计混合模型的装置和方法,由输 入数据(观测值)的等式1的P(X|θ)表示混合模型。

[数学公式1]

P(X|θ)=Σc=1CπcPc(X;φcSc)---(1)

在等式1中,C表示混合数目,X表示作为输入数据的混合模型估计的 目标的随机变量,表示模型(分量)的参数, S1,...,SC表示分量的类型(参数θ的π1,...,πC表示当所述混合数目是1 到C时的混合比,表示当混合数目是1到C时分量S1到 SC的分布参数)。此外,例如,在混合分布的情况下,分量S1到SC的 分量候选可以是{正态分布,对数正态分布和指数分布},或者在混合多 项式曲线模型的情况下,分量S1到SC的分量候选可以是{零到三阶曲 线}。此外,θ是混合数目C和分量类型S1,...,SC的函数。然而,为了 简明省略该函数的描述。

接下来,定义随机变量X的隐变量Z=(Z1,...,ZC)。ZC=1意味着X 是来自第c个分量的数据,ZC=0意味着X是来自除第c个分量以外的数 据。此外,∑c=1CZC=1。将一对X和Z称作“完整变量”(相反,将X 称作“不完整变量”)。如等式2所示,由P(X,Z|θ)来定义完整变量的联 合分布。

[数学公式2]

P(X,Z|θ)=Σc=1C(πcPc(X;φcSc))Zc---(2)

在以下描述中,由xn(n=1,...,N)表示随机变量X的N个观测值(数据), 由Zn(n=1,...,N)表示针对观测值xn的隐变量Z的N个值。如等式3所示, 由P(zn|xn,θ)来表示隐变量Z的数值zn的后验概率:

[数学公式3]

P(zn|xn,θ)πcPc(xn;φcSc)---(3)

尽管在实施例中描述混合模型,本发明并不局限于此。例如,本发明可 以容易地应用于类似模型,例如通过扩展混合模型导出的隐马尔可夫模 型。类似地,尽管实施例中描述了目标随机变量X的分布,本发明并不 局限于此。例如,本发明可以应用于条件模型P(Y|X)(Y是目标随机变量), 例如混合回归模型和混合分类模型。

参考图1,根据本发明的实施例,将由构成混合模型的多个模型表 示的数据(输入数据)111输入到混合模型估计装置110,混合模型估计 装置110针对输入数据111优化混合数目和分量类型,并输出模型估计结 果112。混合模型估计装置110包括数据输入装置(数据输入单元)101、 混合数目设置单元102、初始化单元103、隐变量变异概率计算单元104、 隐变量变异概率存储单元105、模型优化单元106、优化判定单元107、优 化模型选择单元108和模型估计结果输出装置(模型估计结果输出单元) 109。

混合数目设置单元102、初始化单元103、隐变量变异概率计算单元 104、模型优化单元106、优化判定单元107以及优化模型选择单元108是 本发明的处理单元,例如,可以由根据程序的控制操作的计算机(中央 处理单元(CPU)、处理器、数据处理装置等)构成。只要能够实现功能, 其硬件和软件结构可以是任意结构。

提供数据输入装置101以输入数据111,当向数据输入装置101输入 数据时,还输入模型估计必需的参数,例如分量的类型和参数以及混合 数目的候选值。只要能够输入数据111和模型估计必需的参数,可以按照 任意结构来构建数据输入装置101。例如,可以使用例如通信装置、存储 装置和计算机之类的装置来构建数据输入装置101。

混合数目设置单元102通过从输入候选值中进行选择来设置模型混 合数目。下文中,将设置的混合数目表示为C。

初始化单元103执行估计的初始化处理。可以通过任意方法来执行 初始化。例如,可以针对每个分量随机设置分量类型,并根据设置类型, 随机设置每个分量的参数,并随机设置隐变量的变异概率。

隐变量变异概率计算单元104计算隐变量的变异概率。由初始化单 元103或模型优化单元106来计算参数θ,隐变量变异概率计算单元104使 用计算的值。

通过求解由等式4表示的优化问题来计算隐变量的变异概率q(Z):

[数学公式4]

q(t)=argmaxq(ZN){maxq(ZN)Q(t-1)(G(H(t-1),θ(t-1),q(ZN),q(ZN)))}---(4)

ZN=Z1,...,ZN表示数据的隐变量,上标(t)用于表示t次迭代之后通过计 算获得的的值。此外,模型被定义为H=(S1,...,SC)。要被优化的G表示 由等式5计算的贝叶斯后验概率的下限。此外,隐变量变异概率存储单元 105存储由之前迭代计算的隐变量变异概率集合Q(t-1)={q(0),q(1),..., q(t-1)}。

[数学公式5]

G(H,θ,q(ZN),q(ZN))=ΣZNq(ZN){log>(XN,ZN|θ)-C-12log>

-Σc=1CJc2(log(Σn=1Nq(Znc))+Σn=1NZnc-Σn=1Nq(Znc)Σn=1Nq(Znc))-logq(ZN)}---(5)

针对相应数据(之前段中讨论的Q(t-1)被更新为Q(t)),隐变量变异概率存 储单元105存储由隐变量变异概率计算单元104计算的隐变量变异概率。 只要隐变量变异概率存储单元105是例如能够存储针对相应数据计算的 隐变量变异概率的存储器之类的存储装置,隐变量变异概率存储单元105 可以具有任意结构。例如,隐变量变异概率存储单元105可以设置在计算 机外部。

模型优化单元106读取存储在隐变量变异概率存储单元105中的隐 变量变异概率Q(t),并使用等式6来计算t次迭代之后的优化模型H(t)和参数 θ(t)

[数学公式6]

H(t),θ(t)=argmaxH,θ{maxq(ZN)Q(t)(G(H,θ,q(t)(ZN),q(ZN)))}---(6)

上述处理的重点在于由于可以根据分量来分离优化函数,可以单独地优 化S1到SC以及由等式5定义的G的参数到而无需考虑分量类型 的组合(无需考虑指定了S1到SC的哪个类型)。因此,当优化分量的类型 时,可以在没有组合暴增的情况下执行优化。

优化判定单元107使用等式7确定计算的模型后验概率的下限是否 收敛。

[数学公式7]

maxq(ZN)Q(t)G(H(t),θ(t),q(t)(ZN),q(ZN))-maxq(ZN)Q(t-1)G(H(t-1),θ(t-1),q(t-1)(ZN),q(ZN))---(7)

如果确定模型后验概率的下限不收敛,则重复隐变量变异概率计算单元 104到优化判定单元107的处理。

按照这种方式,重复隐变量变异概率计算单元104到优化判定单元 107的处理,以优化模型和参数,由此可以选择使模型后验概率的下限最 大化的适当模型。通过等式8来解释模型后验概率的下限值通过重复处理 单调递增。

[数学公式8]

maxq(ZN)Q(t)G(H(t),θH(t),q(t)(ZN),q(ZN))maxq(ZN)Q(t)G(H(t-1),θH(t-1),q(t)(ZN),q(ZN))

maxq(ZN)Q(t-1)G(H(t-1),θH(t-1),q(t)(ZN),q(ZN))

maxq(ZN)Q(t-1)G(H(t-1),θH(t-1),q(t-1)(ZN),q(ZN))---(8)

通过使用由混合数目设置单元102设置的混合数目C,通过由隐变量变异 概率计算单元104到优化判定单元107执行的处理来优化分量的类型和参 数。

如果模型后验概率值的最大下限(等式7的第一项)大于当前设置 的模型后验概率的下限,则优化模型选择单元108设置该模型作为优化模 型。如果对于混合数目的所有候选值计算模型后验概率的下限(和分量 的类型以及参数)之后计算了优化混合数目,该过程进行到模型估计结 果输出装置109,如果存在还没有执行优化的混合数目候选,则过程返回 到混合数目设置单元102。

模型估计结果输出装置109输出例如优化的混合数目、分量的类型 和参数之类的模型估计结果112。只要模型估计结果输出装置109能够输 出模型估计结果112,模型估计结果输出装置109可以具有任意结构。例 如,可以使用例如通信装置、存储装置和计算机的装置来构建模型估计 结果输出装置109。

参考图2,将简要说明根据实施例的混合模型估计装置110的操作。

首先,将数据111输入到数据输入装置101(步骤S100)。

接下来,混合数目设置单元102从输入的混合数目候选值中选择非 优化混合数目(步骤S101)。

接下来,初始化单元103针对指定混合数目对估计的参数和隐变量 变异概率进行初始化(步骤S102)。

接下来,隐变量变异概率计算单元104计算隐变量变异概率,并将 计算的变异概率存储在重复隐变量变异概率存储单元105中(步骤103)。

接下来,模型优化单元106估计相应分量的类型的参数(步骤S104)。

接下来,优化判定单元107确定模型后验概率的下限是否收敛(步 骤S105和S106)。

如果确定模型后验概率的下限不收敛(步骤S106:否),则在隐变 量变异概率计算单元104、模型优化单元106和优化判定单元107处重复步 骤S103到S106。

如果确定模型后验概率的下限收敛(步骤S106:是),则优化模型 选择单元108将当前设置的优化模型的模型后验概率的下限(混合数目、 类型和参数)与通过截至步骤S106的计算获得的模型的模型后验概率的 下限进行比较,并选择具有较大下限的一个模型作为优化模型(步骤 S107)。

接下来,确定是否剩余未估计的混合数目候选(步骤S108)。

如果存在未估计的混合数目候选(步骤S108:是),则在混合数目 设置单元102、初始化单元103、隐变量变异概率计算单元104、模型优化 单元106、优化判定单元107和优化模型选择单元108处重复步骤S101到 S108。

如果不存在未估计的混合数目候选(步骤S108:否),则模型估计 结果输出装置109输出模型估计结果112,该过程结束(步骤S109)。

因此,根据实施例,通过最大化模型后验概率的下限,能够有效地 估计要混合的模型的所有混合数目、类型和参数。即,通过重复优化处 理以便优化分量的类型和参数以及分量的数目,来优化针对相应分量分 离的模型后验概率的下限。

按照这种方式,针对混合模型的模型选择问题,可以关于模型候选 的数目,根据适当准则快速地进行模型选择,所述模型候选的数目随着 要混合的数目和类型的增多呈指数增大。

下文中将具体描述可应用实施例的混合模型估计装置的模型及其 应用示例。

示例1

(具有不同独立特性的混合分布)

如果使用本实施例的混合模型估计装置,可以针对具有不同独立特 性的多维数据的多个混合分布,快速地优化混合数目和每个分量的独立 性。

例如,在三维正态分布的情况下,可以导出维度无关(相关)的八 种组合,并且可以导出彼此独立的正态分布(协方差矩阵的非对角非零 元素的位置)作为分量候选。

例如,如果针对对具有不同年龄、性别和生活习惯的人进行体检的 检查值(体重、血压、血糖值等)有关输入数据执行分布估计,可以自 动地针对年龄、性别和生活习惯对检查值的相关性建模。除了这种相关 性的建模以外,还可以通过查验隐变量的后验概率值来提取(聚类分析) 具有不同相关关系的检查项组,以便得到数据及其源分量之间的匹配。

此外,实施例的混合模型估计装置可以用于任意多维分布和多维正 态分布。

示例2

(各种混合分布)

如果使用本实施例的混合模型估计装置,可以针对多个不同混合分 布来优化混合数目和分量分布的类型。

例如,在分布候选各包括正态分布、对数正态分布和指数分布的情 况下,可以计算其中优化了分布的数目和参数的混合分布。

例如,可以说明到运行风险估计的应用。通常,在风险分布中,将 具有低风险(的多个事件组例如,被建模为对数正态分布的官方流程失 误)与具有高风险的低频率事件组(例如,被建模为具有高均值的正态 分布的股市失常)相混合。

尽管存在多种类型的风险(多变量),本发明可以自动且恰当地用于 确定分布的类型、数目和参数,并由此估计风险分布。

实施例的混合模型估计装置并不局限于应用到例如正态分布、对数 正态分布和指数分布的特定分布,而可以应用到任意类型的分布。

示例3

(不同随机回归函数的混合分布)

如果使用本实施例的混合模型估计装置,可以针对不同随机回归函 数的混合分布来快速地优化与混合数目和分量的类型相关的回归函数。

例如,现在说明具有多项式曲线(或在多维数据的情况下是曲面) 的回归曲线混合模型。在这种情况下,可以选择具有不同阶数项的多项 式曲线作为每个分量的候选。如果使用本发明的混合模型估计装置,可 以优化混合数目和每个分量的多项式曲线的阶数。

本实施例的混合模型估计装置并不限于应用于多项式曲线,还可以 应用于具有多个类型的任意回归函数的混合模型。

示例4

(不同随机判别函数的混合分布)

如果使用本实施例的混合模型估计装置,可以针对不同判别函数的 混合分布来优化与混合数目和每个分量相关的分类器函数。

例如,给出针对用于使用从汽车数据获得的传感器值来识别汽车故 障类型的故障诊断的说明。由于根据故障和汽车来确定要注意的传感器, 要使用分类器函数的运行条件和传感器值是变化的。

如果使用本实施例的混合模型估计装置,尽管涉及各种数据,可以 自动地估计使用多个传感器值的分类器函数(例如,可以确定针对分量 候选的传感器值)。

示例5

(具有不同输出概率的隐马尔可夫模型的混合分布)

如果使用本实施例的混合模型估计装置,可以针对具有不同输出概 率的隐马尔可夫模型来优化隐状态数目和输出概率的类型以及参数。

例如,即使在由于隐状态导致输出概率是正态分布、对数分布和指 数分布的不同分布的情况下,也能够研究其中优化了分布的数目和参数 的隐马尔可夫模型。

例如,尽管在语音识别中隐状态的估计和输出概率非常重要,由于 不同噪声条件导致在不同环境下测量的语音产生不同输出概率。然而, 根据本实施例,可以在这种条件下进行有效的模型估计。

可以以硬件、软件或其组合的形式来提供混合模型估计装置。在这 种情况下,硬件或软件的结构不局限于特定结构,只要能够提供上述功 能,就可以是任意形式。

以下补充注释中部分或完整地表达了上述实施例和示例。然而,本 发明并不局限于此。

(补充注释1)一种混合模型估计装置,包括:数据输入单元,所 述数据输入单元输入要估计的混合模型的数据和估计所述数据的所述混 合模型必需的混合数目的候选值以及构成所述混合模型的分量的类型和 所述分量的参数;处理单元,所述处理单元根据所述候选值设置所述混 合数目,针对设置的所述混合数目来计算针对随机变量的隐变量的变异 概率,所述随机变量是估计所述数据的所述混合模型的目标,并通过使 用计算的所述隐变量的所述变异概率优化所述分量的所述类型和所述参 数以便最大化针对所述混合模型的每个所述分量分离的模型后验概率的 下限,来优化地估计所述混合模型;以及模型估计结果输出单元,所述 模型估计结果输出单元输出由所述处理单元获得的模型估计结果。

(补充注释2)在补充注释1的混合模型估计装置中,所述处理单 元通过以下操作来优化地获得所述混合模型的所述混合数目:针对所述 混合数目的所有所述候选值,计算所述模型后验概率的所述下限和所述 分量的所述类型和所述参数。

(补充注释3)在补充注释1或2的混合模型估计装置中,如果所 述混合数目由C表示,所述随机变量由X表示,所述分量的所述类型由 S1,...,SC表示,以及所述分量的所述参数由表示,π1,...,πC是当所述混合数目是1到C时的混合比,是当所述混合数目是1到C时分量S1到SC的分布参数,则由等式1 表示所述混合模型,

如果由Z=(Z1,...,ZC)表示所述随机变量X的所述隐变量,则由等式 2定义作为所述随机变量X和所述隐变量Z的对的完整变量的联合分布,

如果由xn(n=1,...,N)表示所述随机变量X的N个数据值,由zn(n= 1,...,N)表示数值xn的所述隐变量Z的N个值,则由等式3来表示所述隐变 量Z的后验概率,

其中,所述处理单元通过求解由等式4表示的优化问题来计算所述 隐变量的所述变异概率,其中,ZN=Z1,...,ZN表示所述隐变量,Q(t)={q(0), q(1),...,q(t)}表示所述隐变量的所述变异概率,上标(t)表示t次迭代之后 计算的值,H=(S1,...,SC)表示所述混合模型,G表示所述模型后验概 率的所述下限,

所述处理单元通过等式5来计算所述模型后验概率的所述下限,

所述处理单元通过等式6,使用由所述隐变量的所述变异概率来计 算t次迭代之后的优化混合模型H(t)和所述优化混合模型的分量的参数 θ(t)

所述处理单元通过使用等式7来确定所述模型后验概率的所述下限 是否收敛,

如果所述处理单元确定所述模型后验概率的所述下限不收敛,则所 述处理单元重复所述等式4到所述等式7的处理,如果所述处理单元确定 所述下限收敛,则所述处理单元将当前设置的优化混合模型的模型后验 概率的下限与通过计算获得的所述模型后验概率的所述下限相比较,并 将较大值设为所述优化混合模型,

其中,所述处理单元针对所述混合数目的所有所述候选值重复所述 等式4到所述等式7的处理以优化地估计所述混合模型。

(补充注释4)在补充注释1到3中的任一个所述的混合模型估计装 置中,所述混合模型包括具有不同独立特性的多个混合分布。

(补充注释5)在补充注释1到3中的任一个所述的混合模型估计装 置中,所述混合模型包括多个不同混合分布。

(补充注释6)在补充注释1到3中的任一个所述的混合模型估计装 置中,所述混合模型包括不同随机回归函数的混合分布。

(补充注释7)在补充注释1到3中的任一个所述的混合模型估计装 置中,所述混合模型包括不同随机判别函数的混合分布。

(补充注释8)在补充注释1到3中的任一个所述的混合模型估计装 置中,所述混合模型包括具有不同输出概率的隐马尔可夫模型的混合分 布。

(补充注释9)一种混合模型估计方法,包括:通过使用输入单元, 输入要估计的混合模型的数据和估计所述数据的所述混合模型必需的混 合数目的候选值以及构成所述混合模型的分量的类型和所述分量的参 数;使处理单元根据所述候选值设置所述混合数目,计算针对随机变量 的隐变量的变异概率,所述随机变量是估计所述数据的所述混合模型的 目标,并通过使用计算的所述隐变量的所述变异概率优化所述分量的所 述类型和所述参数以便最大化针对所述混合模型的每个所述分量分离的 模型后验概率的下限,来优化地估计所述混合模型;以及使模型估计结 果输出单元输出由所述处理单元获得的模型估计结果。

(补充注释10)在补充注释9的混合模型估计方法中,所述处理单 元通过以下操作来优化地获得所述混合模型的所述混合数目:针对所述 混合数目的所有所述候选值,计算所述模型后验概率的所述下限和所述 分量的所述类型和所述参数。

(补充注释11)在补充注释10或11的混合模型估计方法中,如果 所述混合数目由C表示,所述随机变量由X表示,所述分量的所述类型 由S1,...,SC表示,以及所述分量的所述参数由表示,π1,....,πC是当所述混合数目是1到C时的混合比,是当所述混合数目是1到C时分量S1到SC的分布参数,则由等 式1表示所述混合模型,

如果由Z=(Z1,...,ZC)表示所述随机变量X的所述隐变量,则由等式 2定义作为所述随机变量X和所述隐变量Z的对的完整变量的联合分布,

如果由xn(n=1,...,N)表示所述随机变量X的N个数据值,由zn(n= 1,...,N)表示数值xn的所述隐变量Z的N个值,则由等式3来表示所述隐变 量Z的后验概率,

其中,所述处理单元通过求解由等式4表示的优化问题来计算所述 隐变量的所述变异概率,其中,ZN=Z1,...,ZN表示所述隐变量,Q(t)={q(0), q(1),...,q(t)}表示所述隐变量的所述变异概率,上标(t)表示t次迭代之后 计算的值,H=(S1,...,SC)表示所述混合模型,G表示所述模型后验概 率的所述下限,

所述处理单元通过等式5来计算所述模型后验概率,

所述处理单元通过使用所述隐变量的所述变异概率和等式6来计算t 次迭代之后的优化混合模型H(t)和所述优化混合模型的分量的参数θ(t)

所述处理单元通过使用等式7来确定所述模型后验概率的所述下限 是否收敛,

如果所述处理单元确定所述模型后验概率的所述下限不收敛,则所 述处理单元重复所述等式4到所述等式7的处理,如果所述处理单元确定 所述下限收敛,则所述处理单元将当前设置的优化混合模型的模型后验 概率的下限与当前的所述迭代获得的所述模型后验概率的所述下限相比 较,其中,所述处理单元针对所述混合数目的所有所述候选值重复所述 等式4到所述等式7的处理以优化地估计所述混合模型。

(补充注释12)在补充注释9到11中的任一个所述的混合模型估计 方法中,所述混合模型包括具有不同独立特性的多个混合分布。

(补充注释13)在补充注释9到11中的任一个所述的混合模型估计 方法中,所述混合模型包括多个不同混合分布。

(补充注释14)在补充注释9到11中的任一个所述的混合模型估计 方法中,所述混合模型包括不同随机回归函数的混合分布。

(补充注释15)在补充注释9到11中的任一个所述的混合模型估计 方法中,所述混合模型包括不同随机判别函数的混合分布。

(补充注释16)在补充注释9到11中的任一个所述的混合模型估计 方法中,所述混合模型包括具有不同输出概率的隐马尔可夫模型的混合 分布。

(补充注释17)一种混合模型估计程序,用于将计算机操作为一种 混合模型估计装置,所述混合模型估计装置包括:数据输入单元,所述 数据输入单元输入要估计的混合模型的数据和估计所述数据的所述混合 模型必需的混合数目的候选值以及构成所述混合模型的分量的类型和所 述分量的参数;处理单元,所述处理单元根据所述候选值设置所述混合 数目,针对设置的所述混合数目来计算针对随机变量的隐变量的变异概 率,所述随机变量是估计所述数据的所述混合模型的目标,并通过使用 计算的所述隐变量的所述变异概率优化所述分量的所述类型和所述参数 以便最大化针对所述混合模型的每个所述分量分离的模型后验概率的下 限,来优化地估计所述混合模型;以及模型估计结果输出单元,所述模 型估计结果输出单元输出由所述处理单元获得的模型估计结果。

(补充注释18)在补充注释17的混合模型估计程序中,通过以下 操作来优化地获得所述混合模型的优化的所述混合数目:针对所述混合 数目的所有所述候选值,计算所述模型后验概率的所述下限和所述分量 的所述类型和所述参数。

(补充注释19)在补充注释17或18的混合模型估计程序中,如果 所述混合数目由C表示,所述随机变量由X表示,所述分量的所述类型 由S1,...,SC表示,以及所述分量的所述参数由表示,π1,...,πC是当所述混合数目是1到C时的混合比,是当所述混合数目是1到C时分量S1到SC的分布参数,则由等 式1表示所述混合模型,

如果由Z=(Z1,...,ZC)表示所述随机变量X的所述隐变量,则由等式 2定义作为所述随机变量X和所述隐变量Z的对的完整变量的联合分布,

如果由xn(n=1,...,N)表示所述随机变量X的N个数据值,由zn(n= 1,...,N)表示数值xn的所述隐变量Z的N个值,则由等式3来表示所述隐变 量Z的后验概率,

其中,所述处理单元通过求解由等式4表示的优化问题来计算所述 隐变量的所述变异概率,其中,ZN=Z1,...,ZN表示所述隐变量,Q(t)={q(0), q(1),...,q(t)}表示所述隐变量的所述变异概率,上标(t)表示t次迭代之后 计算的值,H=(S1,...,SC)表示所述混合模型,G表示所述模型后验概 率的所述下限,

所述处理单元通过等式5来计算所述模型后验概率,

所述处理单元通过使用所述隐变量的所述变异概率和等式6来计算t 次迭代之后的优化混合模型H(t)和所述优化混合模型的分量的参数θ(t)

所述处理单元通过使用等式7来确定所述模型后验概率的所述下限 是否收敛,

如果所述处理单元确定所述模型后验概率的所述下限不收敛,则所 述处理单元重复所述等式4到所述等式7的处理,如果所述处理单元确定 所述下限收敛,则所述处理单元将当前设置的优化混合模型的模型后验 概率的下限与当前的所述迭代之后获得的所述模型后验概率的所述下限 相比较,

其中,所述处理单元针对所述混合数目的所有所述候选值重复所述 等式4到所述等式7的处理以优化地估计所述混合模型。

(补充注释20)在补充注释17到19中的任一个所述的混合模型估计 程序中,所述混合模型包括具有不同独立特性的多个混合分布。

(补充注释21)在补充注释17到19中的任一个所述的混合模型估计 程序中,所述混合模型包括多个不同混合分布。

(补充注释22)在补充注释17到19中的任一个所述的混合模型估计 程序中,所述混合模型包括不同随机回归函数的混合分布。

(补充注释23)在补充注释17到19中的任一个所述的混合模型估计 程序中,所述混合模型包括不同随机判别函数的混合分布。

(补充注释24)在补充注释17到19中的任一个所述的混合模型估计 程序中,所述混合模型包括具有不同输出概率的隐马尔可夫模型的混合 分布。

尽管已经参照实施例和示例描述了本发明,本发明并不局限于实施 例的示例。本领域技术人员应理解,在本发明的范围内,可以对本发明 的结构和细节进行各种改变。

本申请要求于2011年3月18日递交的日本专利申请 No.2011-060732的优先权,该申请一并在此作为参考。

工业实用性

如上所述,本发明可以用作多变量数据混合模型估计装置、混合模 型估计方法和混合模型估计程序。例如,本发明可以用作一种装置、方 法或程序,用于针对以下分布来估计混合模型:具有不同独立特性的多 个混合分布、多个不同混合分布、不同类型随机回归函数的混合分布、 不同类型随机判别函数的混合分布、具有不同输出概率的隐马尔可夫模 型等。

参考符号列表

101  数据输入装置(数据输入单元)

102  混合数目设置单元

103  初始化单元

104  隐变量变异概率计算单元

105  隐变量变异概率存储单元

106  模型优化单元

107  优化判定单元

108  优化模型选择单元

109  模型估计结果输出装置(模型估计结果输出单元)

110  混合模型估计装置

111  输入数据

112  模型估计结果

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号