首页> 中文会议>第五届和谐人机环境联合学术会议（HHME2009）、第18届全国多媒体学术会议(NCMT2009)、第4届全国普适计算学术会议(PCC2009)、第5届全国人机交互学术会议(CHCI2009) >基于Alize工具包的广播音频播音员自动标注系统

基于Alize工具包的广播音频播音员自动标注系统

页面导航

摘要
著录项
相似文献
相关主题

摘要

本文设计与实现了一个基于Alize 开源说话人识别工具包的广播音频播音员自动标注系统,对中央电视台<新闻联播>节目主持人以及重要说话人进行自动身份识别、分割与标注.采用Alize 工具包提供的Feature Server、Mixture Server和Statistics Server,实现了基于高斯混合模型(GMM)的说话人识别模块.系统引入音频分类、语音分割等模块,音频分类模块对新闻音频中存在的多种音频类型进行区分,仅有被标注为语音的部分被挑选出进行说话人识别和标注.采用一种分层策略进行播音员自动标注,先按身份已知和未知对说话人分类,再对未知说话人进行性别标注.实验表明,该系统的说话人识别错误率低于0.05,对完整<新闻联播>节目的说话人自动标注错误率为0.229.

著录项

来源
《第五届和谐人机环境联合学术会议（HHME2009）、第18届全国多媒体学术会议(NCMT2009)、第4届全国普适计算学术会议(PCC2009)、第5届全国人机交互学术会议(CHCI2009)》|2009年|226-231|共6页
会议地点西安
作者
卢咪咪; 谢磊; 郑李磊; 杨玉莲; 张艳宁;
展开▼
作者单位

中国计算机学会;

中国图象图形学学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类语音识别与设备;
关键词
说话人识别; 声纹识别; 多媒体检索; 音频归档; Alize工具包; 高斯混合模型;

相似文献

中文文献
外文文献
专利

1. 双网双(多)站在广播音频播出系统中的应用——基于计算机网络系统的广播安全播出解决方案 [J] . 龚亮 . 科技创新导报 . 2010,第012期
2. 基于Intel Xscale的嵌入式音频系统的研究与实现 [J] . 凌杰 ,曹强 . 微计算机信息 . 2006,第014期
3. 基于Intel Xscale的嵌入式音频系统的研究与实现 [J] . 凌杰 ,曹强 . 微计算机信息 . 2006,第05Z期
4. 基于Laravel RESTful的考点音频广播系统的设计 [J] . 汤明伟 ,黄成 . 电子技术与软件工程 . 2021,第009期
5. 中小型广播电台基于AOIP网络音频系统的一体化建设 [J] . 俞荣 . 电声技术 . 2020,第002期
6. 构建电台播控中心数字化音频网络的一种模式——谈TELECAST数字音频广播播控系统的技术方案 [C] . 郑舒畅 ,吴庭良 ,郑正峰 . 首届中国广播技术发展论坛 . 2003
7. 基于FPGA的以太网音频广播系统的设计 [A] . 徐源 . 2011

基于Alize工具包的广播音频播音员自动标注系统

摘要

著录项

相似文献

相关主题

期刊订阅