基于Alize工具包的广播音频播音员自动标注系统

摘要

本文设计与实现了一个基于Alize 开源说话人识别工具包的广播音频播音员自动标注系统,对中央电视台<新闻联播>节目主持人以及重要说话人进行自动身份识别、分割与标注.采用Alize 工具包提供的Feature Server、Mixture Server和Statistics Server,实现了基于高斯混合模型(GMM)的说话人识别模块.系统引入音频分类、语音分割等模块,音频分类模块对新闻音频中存在的多种音频类型进行区分,仅有被标注为语音的部分被挑选出进行说话人识别和标注.采用一种分层策略进行播音员自动标注,先按身份已知和未知对说话人分类,再对未知说话人进行性别标注.实验表明,该系统的说话人识别错误率低于0.05,对完整<新闻联播>节目的说话人自动标注错误率为0.229.

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号