要解决的问题:通过参考音频部分搜索视频的可选音频部分,音频和音乐内容,从而获取在两个音频部分中具有相似心理印象的场景作为搜索结果。
解决方案:一种方法包括以下步骤:将音频除以无音频部分(S1);提取与所分割的音频部分的基频或音频的强调程度有关的节奏特性(S2);计算参考音频部分的节奏特性与作为调查对象的一个或多个音频部分的节奏特性之间的距离(S3)。通过计算出的距离推定相似度为规定值以上的声音区间(S4)。
版权:(C)2011,日本特许厅&INPIT
公开/公告号JP5182892B2
专利类型
公开/公告日2013-04-17
原文格式PDF
申请/专利权人 日本電信電話株式会社;
申请/专利号JP20090218455
申请日2009-09-24
分类号G10L25/54;G10L25/90;G10L25/51;
国家 JP
入库时间 2022-08-21 16:55:55