首页> 中国专利> 一种说话人分段聚类方法及装置

一种说话人分段聚类方法及装置

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提供一种说话人分段聚类方法及装置，以解决相关技术中处理短时说话人语音时，性能下降导致说话人聚类效果较差的问题。该方法包括：将待聚类语音划分为多个子语音段；通过权重联合概率线性判别分析WT‑PLDA模型对基于划分得到的各子语音段的I‑vector提取出各子语音段的特征信息W‑vector，所述WT‑PLDA模型的模型参数至少包括：均值向量、说话人子空间的投影矩阵、说话人因子的隐藏变量以及残差因子；通过概率线性判别分析PLDA根据划分后多个子语音段的所述W‑vector对该多个子语音段循环进行多次聚类，直至所述多个子语音段被聚类为两类。本发明提高了说话人的聚类效果。

著录项

公开/公告号CN109859742A

专利类型发明专利
公开/公告日2019-06-07

原文格式PDF
申请/专利权人国家计算机网络与信息安全管理中心;中国科学院声学研究所;
展开▼

申请/专利号CN201910015449.8
发明设计人袁庆升;包秀国;汪立东;张鸿;杜翠兰;王文超;颜永红;陈志高;
展开▼

申请日2019-01-08
分类号G10L15/02(20060101);G10L15/04(20130101);G10L15/06(20130101);G10L15/26(20060101);G10L25/51(20130101);
代理机构11010 工业和信息化部电子专利中心;
代理人李勤媛
地址 100029 北京市朝阳区裕民路甲3号
入库时间 2024-02-19 11:04:53

法律信息

法律状态公告日

法律状态信息

法律状态
2019-07-02

实质审查的生效 IPC(主分类):G10L15/02 申请日:20190108

实质审查的生效
2019-06-07

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种说话人分段聚类方法及装置 [P] . 中国专利： CN109859742B . 2021.04.09
2. 一种基于因子分析的说话人分段聚类方法及系统 [P] . 中国专利： CN107342077A . 2017-11-10
3. Speaker clustering method and speaker adaptation method based on model transformation, and apparatus using the same [P] . 韩国专利： KR100612840B1 . 2006-08-18

机译：基于模型变换的说话人聚类方法和说话人自适应方法以及使用该方法的装置
4. SPEAKER CLUSTERING METHOD AND SPEAKER ADAPTATION METHOD BASED ON MODEL TRANSFORMATION, AND APPARATUS USING THE SAME [P] . 韩国专利： KR20050082253A . 2005-08-23

机译：基于模型变换的说话人聚类方法和说话人自适应方法，以及使用该方法的装置
5. Method of speaker clustering for unknown speakers in conversational audio data [P] . 美国专利： US5598507A . 1997-01-28

机译：对话音频数据中未知说话人的说话人聚类方法