首页> 中国专利> 自监督音高估计

自监督音高估计

摘要

示例实施例涉及用于训练人工神经网络或其它机器学习编码器以准确预测半音或以其它方式对数标度的音高空间中的输入音频样本的音高的技术。示例方法可以包括通过将两个不同的音高位移应用于音频训练数据的样本,从该音频数据的样本生成两个训练样本。这可以通过将该音频数据的样本转换到频域然后使转换后的数据移位来完成。然后将这些已知的位移与通过将所述两个训练样本应用于编码器而生成的预测音高进行比较。然后基于比较来更新编码器,使得由编码器输出的相对音高在准确性方面得到改善。然后可以使用一个或更多个用绝对音高值标记的音频样本来校准训练过的编码器所生成的相对音高值。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-05-27

    公开

    国际专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号