首页> 中国专利> 音频编辑系统和音频编辑方法

音频编辑系统和音频编辑方法

摘要

音频编辑系统包括:多个初始切分装置,分别将来自多个声道的音频流初始切分为多个不同的段落;多声道融合装置,对多个初始切分装置的切分点进行综合,并从每两个相邻的切分点之间选择最优的声道的音频流,从而得到多个初始切分片段,并且将得到的多个初始切分片段融合形成统一音频数据文件;音频聚类装置,基于层次聚类的算法,对多个初始切分片段进行有监督聚类,将属于同一性质的初始切分片段聚成一个类别;重新切分装置,利用音频聚类装置聚类的结果,训练得到每个类别相应的隐马尔科夫模型,并对统一音频文件进行维特比对齐切分,得到重新切分后的音频流。通过以上高精度的说话人切分系统,能够提高最终说话人聚类的准确性。

著录项

  • 公开/公告号CN102543080B

    专利类型发明专利

  • 公开/公告日2016-12-14

    原文格式PDF

  • 申请/专利权人 索尼公司;中国科学院声学研究所;

    申请/专利号CN201010614165.X

  • 申请日2010-12-24

  • 分类号G10L25/48(20130101);

  • 代理机构11105 北京市柳沈律师事务所;

  • 代理人黄小临

  • 地址 日本东京都

  • 入库时间 2022-08-23 09:49:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-12-14

    授权

    授权

  • 2014-02-05

    实质审查的生效 IPC(主分类):G10L 15/14 申请日:20101224

    实质审查的生效

  • 2012-07-04

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号