摘要:本文提出了一种改进的声调核模型用于汉语普通话的声调识别.在改进的声调核模型中,基频曲线被划分为起始野值段,起始过渡段,声调核,末尾过渡段,末尾野值段.其中,声调核最能体现声调的基频变化趋势,是决定声调类型的关键部分.本文提出的自适应声调核提取算法,首先利用Viterbi算法自适应的将基频曲线划分为若干部分,并根据自相关函数移除首尾的野值段,再利用T假设检验合并相邻的线性部分,得到最终的分段结果.根据不同分段情况,提取基频曲线中的声调核.利用HMMs的说话人无关的声调识别对比试验表明,利用本文提出的模型和算法得到的4种声调的平均识别率比利用整个基频曲线的声学特征得到的4种声调的平均识别率提高了10.8%.实验结果表明利用改进的声调核模型和自适应声调核提取算法可有效提高4种声调的平均识别率.