本文在对现有主流说话人识别语音数据库进行分析和对比的基础上,提出并建立第一个免费且开源的面向智能手机信道下文本相关的用于说话人识别研究的中文普通话语料库MTDSR(Mandarin corpus for Text Dependent Speaker Recognition).该数据库的特点是:包含181个说话人;每位录音者的录音语料包括20句8位随机字符串、15句古诗词、15句新闻句子、20-30句短语和日常对话、2首歌词;录音总时长约70小时,在4种不同型号智能手机信道下录制.本文最后对MTDSR进行了GMM-UBM和i-vector说话人确认算法的基线实验.
展开▼