首页> 中国专利> 自监督音高估计

自监督音高估计

页面导航

摘要
著录项
法律信息
相似文献

摘要

示例实施例涉及用于训练人工神经网络或其它机器学习编码器以准确预测半音或以其它方式对数标度的音高空间中的输入音频样本的音高的技术。示例方法可以包括通过将两个不同的音高位移应用于音频训练数据的样本，从该音频数据的样本生成两个训练样本。这可以通过将该音频数据的样本转换到频域然后使转换后的数据移位来完成。然后将这些已知的位移与通过将所述两个训练样本应用于编码器而生成的预测音高进行比较。然后基于比较来更新编码器，使得由编码器输出的相对音高在准确性方面得到改善。然后可以使用一个或更多个用绝对音高值标记的音频样本来校准训练过的编码器所生成的相对音高值。

著录项

公开/公告号CN114556473A

专利类型发明专利
公开/公告日2022-05-27

原文格式PDF
申请/专利权人谷歌有限责任公司;
展开▼

申请/专利号CN202080072283.4
发明设计人 M.塔吉利亚萨奇;M.韦尔米罗维奇;M.沙里菲;D.罗布雷克;C.弗兰克;B.格费尔勒;
展开▼

申请日2020-09-25
分类号G10L25/60;G10L25/30;G10L25/90;
代理机构北京市柳沈律师事务所;
代理人金玉洁
地址美国加利福尼亚州
入库时间 2023-06-19 15:26:02

法律信息

法律状态公告日

法律状态信息

法律状态
2022-05-27

公开

国际专利申请公布

相似文献

专利
中文文献
外文文献

1. 复调音乐多音高估计方法及伪双谱在多音高估计中的应用 [P] . 中国专利： CN107103908B . 2019.12.24
2. 复调音乐多音高估计方法及伪双谱在多音高估计中的应用 [P] . 中国专利： CN107103908A . 2017-08-29