首页> 中国专利> 乐曲认识方法与系统、存放乐曲认识程序的存储介质、商业广告认识方法与系统、存放商业广告认识程序的存储介质

乐曲认识方法与系统、存放乐曲认识程序的存储介质、商业广告认识方法与系统、存放商业广告认识程序的存储介质

摘要

提供了一种从接收数据生成广播内容物播出单的播出单生成方法。方法包括如下步骤:预先抽出广播内容物特征保存于内容物特征文件,将广播内容物关联信息保存于内容物信息数据库;抽出接收数据特征而保存于广播特征文件;通过对照内容物特征文件和广播特征文件数据来检索给定种类广播内容物;若给定种类广播内容物名被判明则将对应于给定种类广播内容物的数据作为检索结果文件保存;从检索结果文件与内容物信息数据库生成给定种类广播内容物播出单。

著录项

  • 公开/公告号CN1471703A

    专利类型发明专利

  • 公开/公告日2004-01-28

    原文格式PDF

  • 申请/专利权人 NTT通信公司;

    申请/专利号CN01817820.0

  • 发明设计人 伊能美和子;小林竜浩;

    申请日2001-10-22

  • 分类号G10K15/02;G10L15/08;G06F17/30;

  • 代理机构北京三友知识产权代理有限公司;

  • 代理人崔晓光

  • 地址 日本东京

  • 入库时间 2023-12-17 15:05:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2011-12-28

    未缴年费专利权终止 IPC(主分类):G10K15/02 授权公告日:20090211 终止日期:20101022 申请日:20011022

    专利权的终止

  • 2009-02-11

    授权

    授权

  • 2004-04-07

    实质审查的生效

    实质审查的生效

  • 2004-01-28

    公开

    公开

说明书

技术领域

本发明涉及乐曲认识方法与系统以及存放乐曲认识程序的存储介质,尤其是涉及实时地对TV(电视)及FM(调频广播)等广播的图像或语音信息中所广播的乐曲加以认识与储存的乐曲认识方法与系统、以及存放乐曲认识程序的存储介质。

另外,本发明还涉及CM(Commercial,商业广告)认识方法与系统、以及存放CM认程序的存储介质,尤其是涉及实时地对电视及FM等广播的CM加以认识与储存的CM认识方法与系统、以及存放CM认识程序的存储介质。

背景技术

已往,并不存在对实时广播的图像信息及音乐信息等内容物(contents)中使用的乐曲名加以实时认识而储存于存储装置的系统。

又,对实时广播的CM加以实时认识、储存的装置也不存在。而仅以给定长度分割出的CM信息来比较认识CM数据的系统则更不存在。

如上所述,在已往系统中,不存在对被播放乐曲进行监视的技术,不能将乐曲名同播放时刻信息一道储存到存储装置里。当对某乐曲名附加时刻信息时只有靠人工处理,不能实时地附加所广播乐曲名、该乐曲被广播的时刻信息。

又,关于CM也一样,不存在对被播放图像或语音信息中被广播的CM实时认识储存的装置,除了靠人工处理别无它法,使得在实时性、扩大规模上受到限制。

发明内容

针对上述情况,本发明目的就在于提供一种可以对电视及FM等播放的图像或语音信息中所广播乐曲的乐曲名实时认识与储存的播出单生成技术。

又,本发明目的还在于提供一种不仅可以对无线播放的还可以对通过因特网等通信网络譬如以倾泻下载方式传送的广播数据、在既无标志信息也无透明信息的情况下也可以实时地对目标乐曲数据加以比较认识的播出单生成技术。

又,本发明目的还在于提供一种可以对电视及TM等播放的图像或语音信息中被广播的CM实时认识与储存的CM认识技术。

为实现上述目的,本发明可行如下技术方案。

本发明为一种播出单生成方法,从所接收数据生成内容物的播出单,其中,包括如下步骤:

预先抽出内容物特征而保存于内容物特征文件中,将该内容物关联信息保存于内容物信息数据库;

抽出上述所接收数据的特征而保存于数据特征文件中;

通过对照上述内容物特征文件数据和上述数据特征文件数据来检索内容物;

若上述内容物特征文件数据和上述数据特征文件数据一致,则将对应于该数据的数据作为检索结果文件保存;

从上述检索结果文件与上述内容物信息数据库生成该内容物的播出单。

根据本发明,可以根据被播放的广播数据等自动生成时间序列播出单。上述的所谓数据特征文件譬如是广播特征文件。

在上述技术方案中,还可包括如是步骤:当于上述检索步骤上述数据特征文件中某数据不含在上述内容物特征文件中时,将该数据登记于上述内容物特征文件中。

根据本发明,可以自动向内容特征文件登记数据。

在上述技术方案中,还可包括如下步骤:

使上述内容物特征文件中不含有的数据所对应的内容物可为人所视听;

将该内容物关联信息登记于上述内容物信息数据库。

根据本发明,可以自动地将业已登记的内容物特征文件的数据所关联信息进行登记,可以利用该登记信息自动地生成时间序列播出单。

在上述技术方案中,还可包括如下步骤:

当于上述检索步骤上述数据特征文件中某数据不含在上述内容物特征文件中时,使该数据所对应的内容物可为人所视听;

将该内容物同该内容物关联信息一道追加于上述播出单。

根据本发明,可以补充时间序列播出单,可以生成更高精度的播出单。

为实现上述目的,本发明还可行如下技术方案。

本发明为一种乐曲认识方法,从所接收数据认识乐曲,其中,包括如下步骤:

预先抽出乐曲内容物特征而保存于内容物特征文件中;

抽出上述所接收数据的特征而保存于广播特征文件中;

通过对照上述内容物特征文件和上述广播特征文件的数据来检索乐曲;

若乐曲名被判明,则将该乐曲名作为检索结果文件保存;

从上述检索结果文件生成乐曲的时间序列播出单。

根据本发明,可以自动生成乐曲有关时间序列播出单。

在上述技术方案中,还可包括如下步骤:

判定一下上述所接收数据是否为乐曲;

若为乐曲,则将表明其数据是乐曲的事项以及该数据接收时刻保存于乐曲抽出文件中;

当于上述乐曲检索步骤中上述广播特征文件中某数据的乐曲名没被判明时,将该数据保存于乐曲名未抽出文件中;

从上述广播特征文件和上述乐曲抽出文件以及上述乐曲名未抽出文件生成乐曲未检出文件。

根据本发明,对于尽管是乐曲但却没有记载于时间序列播出单者也可以掌握。

在上述技术方案中,还可包括如下步骤:

使上述乐曲未检出文件中记录的乐曲可为人所闻听;

将同该乐曲未检出文件中业已记录的乐曲有关的乐曲名及时刻追加于上述播出单中。

根据本发明,可以补充时间序列播出单,可以生成更高精度的播出单。

在上述技术方案中,可以利用上述检索结果文件和具有被同乐曲名赋与关联的信息的内容物信息数据库,生成上述时间序列播出单。

上述时间序列播出单可包括时刻、该时刻广播的乐曲名、以及该乐曲名关联的信息。

根据本发明,可以自动生成具有乐曲名及该乐曲名关联的种种信息的时间序列播出单。

在上述技术方案中,可在多地域接收广播数据,将在各地域接收的数据发送至中心系统,在该中心装置以上述乐曲认识方法生成上述时间序列播出单。

根据本发明,可以生成同各地广播台所广播内容有关的时间序列播出单。

又,本发明还可以是一种乐曲认识方法,从所接收数据认识乐曲,其中,包括如下步骤:

预先抽出乐曲内容物特征而保存于内容物特征文件中;

在多地域接收广播数据;

在各地域,抽出上述所接收数据的特征而作为广播特征文件数据发送至中心系统;

在该中心系统,通过对照上述内容物特征文件和上述广播特征文件的数据来检索乐曲;

若乐曲名被判明,则将该乐曲名作为检索结果文件保存;

从上述检索结果文件生成乐曲的时间序列播出单。

根据发明,由于可以在各地生成广播特征文件而传送至中心,所以可降低对中心的传送量。

在上述技术方案中,还可具备下列特征:

上述内容物信息数据库及上述乐曲名关联的信息包含CM有关信息;

上述内容物信息数据库中CM有关信息预先以CM认识方法登记于上述内容物信息数据库中;

该CM认识方法包括如下步骤:

从所接收数据检出CM数据;

抽出上述CM数据特征而保存于广播特征文件中;

对照上述广播特征文件和预先存放有CM内容物特征的主CM内容物特征文件的数据;

当广播特征文件中数据不存在于主CM内容物特征文件中时,将该数据作为新CM登记于含在上述内容物信息数据库中的主CM内容物特征文件中。

根据本发明,可以生成含有CM信息的时间序列播出单。

为实现上述目的,本发明还可行如下技术方案。

本发明为一种CM认识方法,从所接收数据认识CM,保存所认识CM数据,其特征在于,包括如下步骤:

从所接收数据检出CM数据;

抽出上述CM数据特征而保存于广播特征文件中;

对照上述广播特征文件和预先存放有CM内容物特征的主CM内容物特征文件的数据;

当上述广播特征文件中数据不存在于主CM内容物特征文件中时,将该数据作为新CM登记于主CM内容物特征文件中。

这样,可以使得由人工进行的CM监测作业实现自动化,可以提供能够用于生成时间序列播出单的CM数据。

在上述技术方案中,上述从所接收数据检出CM数据的步骤可包括检出CM数据开始点及结束点的步骤。

可在抽出上述CM数据特征之际,对一定长度部分—自被检出的上述CM数据的上述开始点与上述结束点之中心向该开始点与该结束点侧均等地延长而切割的部分—加以特征化。

根据本发明,可以吸收CM数据输入误差。

在上述技术方案中,还可包括如下步骤:

根据上述数据对照结果显示不存在于主CM内容物特征文件中的CM数据;

将该CM数据关联信息登记于含主CM内容物特征文件的CM管理数据库群的各数据库中。

根据本发明,可以对业已自动地登记于主CM内容物特征文件的CM数据关联信息进行登记,利用该信息可以生成具有CM相关信息的时间序列播出单。

另外,本发明其它目的、特征、功能以及优点可通过以下结合附图对细节的描述得以清楚理解。

附图说明

图1是本发明原理示意图。

图2是本发明原理结构图。

图3是本发明乐曲认识系统框图。

图4是本发明乐曲认识系统概要动作时序流程图。

图5是本发明CM认识系统框图。

图6是本发明CM认识系统概要动作流程图(其一)。

图7是本发明CM认识系统概要动作流程图(其二)。

图8是本发明第1具体例的乐曲认识系统框图。

图9是本发明第1具体例的乐曲认识系统动作流程图。

图10是本发明第1实施例的应用例示意图。

图11是制作时间序列播出单时所用的各个文件其及关系的示意图。

图12是时间序列播出单属性信息的示意图。

图13是时间序列播出单属性信息的示意图。

图14是本发明第2具体例的CM认识系统框图。

图15是用于CM特征数据的剪辑方法的示意图。

图16是本发明第3具体例的系统结构图。

图17是图16所示系统概要动作流程图。

图18是本发明第3具体例的系统的详细动作流程图。

图19是乐曲数据储存方法示意图。

图20是CM数据储存方法示意图。

图21是从乐曲·CM未抽出文件生成内容物特征文件的处理的示意图。

具体实施方式

第一实施方案

图1及图2示出了本实施例原理。

如图1所示,根据本实施例,预先抽出内容物(contents)特征而保存于内容物特征文件(步骤1);抽出所接收数据特征而保存于广播特征文件(步骤2);通过对照内容物特征文件与广播特征文件的数据来检索乐曲(步骤3);若乐曲被判明则将该乐曲有关信息作为检索结果文件加以保存(步骤4);根据检索结果文件生成乐曲的时间序列播出单(步骤5)。

又,如图2所示,本实施方案的乐曲认识系统原理结构包括:内容物生成单元300—预先生成内容物,且抽出乐曲内容物特征而保存于内容物特征文件320;和特征抽出单元105—抽出所接收数据特征而保存于广播特征文件140;和乐曲检索单元120—通过对照内容物特征文件320与广播特征文件140的数据来检索乐曲,且将检索结果保存于检索结果文件150;以及播出单生成单元200—从检索结果文件150生成时间序列的乐曲的时间序列播出单。

图3示出了本发明乐曲认识系统概要。该图所示系统包括:播放捕捉检索装置100、乐曲确认登记装置200、内容物生成装置300。这些装置都由PC(个人计算机)等构成。须指出的是,以一台具备所有这些装置的功能的PC也可以实现本系统,只不过考虑到PC处理负荷、性能价格比以及当前硬件规格等情况而分成3个装置。

播放捕捉检索装置100包括:播放捕捉部110、检索部120、乐曲抽出文件130、广播特征文件140、检索结果文件150、乐曲名未抽出文件160、乐曲未检出文件170、以及时刻数据提供部180。

播放捕捉部110就电视台、电台广播连续地监测广播数据,判定一下所监测广播数据是乐曲还是非乐曲;若是乐曲,则将表明监测时间内所广播的是乐曲的事项记录于乐曲抽出文件130,而且从该乐曲中实时地以7.5秒间隔抽出广播数据特征而保存于广播特征文件140。又,以7.5秒间隔将该乐曲作为数码数据保存于图中省略的文件中。在此,播放捕捉部110是根据来自时刻数据提供部180的时刻信息进行上述处理的。另外,对被捕捉信息记录时赋与时间标识。

这里,之所以用7.5秒间隔,是由于一般在想知道CM中所插播乐曲时CM播放时间目前最短是15秒,通过取其一半时间作检索时间可以切实地进行乐曲数据检索。

须指出的是,关于播放捕捉部110进行的是乐曲还是非乐曲的判定,可以利用预先判定是乐曲还是非乐曲(不是乐曲,而是讲话等)的已有技术(譬如”乐览”(乐曲非乐曲检出技术):特愿平8-340293,特愿平10-68158等)。播放捕捉部110利用该技术把表明判定出是乐曲的事项登记于乐曲抽出文件130。

检索部120将保存有内容物生成装置300所生成内容物特征的文件读取于内存,进一步还读取广播特征文件140,进行两个文件的对照(matching),将对照结果存放于检索结果文件150。将没有对照上的数据存放于乐曲名未抽出文件160。

关于上述对照检索,可以采用日本专利第3065314号”高速信号检索方法与装置及其存储介质”等记载的学习活动(learning active)检索方法。根据该方法,求内容物特征文件数据与广播特征文件数据的类似值,通过比较所求类似值与阈值来进行检索。欲知其详细请参见上述日本专利第3065314号。

乐曲抽出文件130由表明是乐曲的信息被赋与时间标识的数据构成,播放捕捉检索部100所生成的广播特征文件是TAZ文件(二进制文件)。须指出的是,TAZ文件是学习活动检索中可以进行高速比较处理的文件。

还有,对于广播内容,将之保存于图中省略的WAV文件等之中。

在广播特征文件140,保存播放捕捉部110自动捕捉的被播放的广播数据而且抽出特征后的广播数据的特征数据。

在乐曲未检出文件170,保存从乐曲抽出文件130、乐曲名未抽出文件160以及广播特征文件140抽出的虽为乐曲但却没有对照出来的数据。

在检索结果文件150,保存检索部120对内容物生成装置300所生成的内容物特征文件(后述)和广播特征文件140的对照结果。即,对照结果为一致的数据所对应的信息(乐曲名等)将保存于检索结果文件,而将广播特征文件140当中的在内容物特征文件不存在的数据保存于乐曲名未抽出文件(后述)。

乐曲确认登记装置200包括乐曲确认部210以及登记部220,其输出时间序列播出单230。

乐曲确认部210利用检索结果文件150以及内容物信息数据库330来抽出业已被认识的乐曲所对应的时刻、乐曲名、作曲者、节目(CM)名、委托客户、商品、演员、以及CD信息等,将这些提供给登记部220。

登记部220按时间顺序将乐曲确认部210所抽出的内容登记于时间序列播出单230。

又,在乐曲确认登记装置200,通过操作者对存放在乐曲未检出文件的广播内容进行确认来认识乐曲,将对应数据追加于时间序列播出单。另外,可以通过操作者根据乐曲未检出文件时刻信息闻听由播放捕捉部110以WAV文件等方式捕捉的乐曲来确认广播内容。

内容物生成装置300包括内容物生成部310、内容物特征文件320、以及内容物信息数据库330。

内容物生成部310从记录有乐曲的介质获取内容物,把乐曲名以及可以通用于内容物特征文件320的属性数据保存于内容物信息数据库330,进一步还抽出乐曲特征同乐曲名一起保存于内容物特征文件320。

内容物特征文件320是内容物生成部310所生成的文件,其中保存乐曲名及该乐曲特征信息。

内容物生成部310将乐曲的所有属性数据都存放于内容物信息数据库330。

下面描述上述乐曲认识系统的动作。

图4示出了本发明乐曲认识系统动作概要。

步骤101:在内容物生成装置300,把来自乐曲内容物存储介质等的乐曲以及该乐曲的属性数据登记于内容物信息数据库330。属性数据譬如是乐曲名、作曲者、节目名、委托客户、商品名、演员名等信息。

步骤102:在内容物生成装置300,抽出乐曲特征而保存于内容物特征文件320。

到此为止的处理是下述处理的前处理。

步骤103:在播放捕捉检索装置100捕捉被播放图像或语音等。在此,“被播放图像或语音等”包括通过因特网广播的图像或语音等。

步骤104:播放捕捉检索装置100利用任意一种就捕捉内容检测是乐曲还是非乐曲的技术来检测广播数据是乐曲还是非乐曲。

步骤105:在步骤103所捕捉的是乐曲的场合,将表明该时间广播的是乐曲的事项记录于乐曲抽出文件130。所谓记录表明是乐曲的事项譬如是指在该时间建立代表乐曲的标志。

步骤106:在上述步骤104、105的同时,还实时地以7.5秒间隔抽出乐曲特征而保存于广播特征文件140。又,乐曲的广播数据也保存于图中省略的文件中。

步骤107:接着在播放捕捉检索装置100,启动检索应用程序以进行乐曲检索,而且还把于上述步骤102由内容物生成装置300生成的内容物特征文件320的内容读入内存。

步骤108:播放捕捉检索装置100的检索部120还读入广播特征文件140,进行两个文件的对照。这时,设采用上述学习活动检索技术。

步骤109:将上述对照结果保存于检索结果文件150。对于没对照上的特征数据,将存放于乐曲名未抽出文件160。

步骤110:接着在乐曲确认登记装置200,从内容物生成装置300读取内容物信息数据库330的各内容。

步骤111:乐曲确认登记装置200还进一步从播放捕捉检索装置100读取检索结果文件150。

步骤112:据此,乐曲确认登记装置200从检索结果文件150中数据和内容物信息数据库330中数据抽出乐曲名、作曲者、所捕捉节目、委托客户、商品、演员等信息,进行将这些数据按时间顺序排列的处理,生成时间序列播出单而当作时间序列播出单数据库230保存起来。

步骤113:还通过操作者视听乐曲来确认同记录于乐曲来检出播出单的特征数据对应的乐曲名,以补充时间序列播出单。

第二实施方案

下面,作为本发明第2实施方案来说明认识保存电视以及FM/AM所播放的图像或语音信息当中CM(商业广告)的CM认识系统。须指出的是,通过参照该CM认识系统所生成的CM数据,可以从第一实施方案中被认识的乐曲生成包含CM数据数据的播出单。

图5是本发明CM认识系统概要示意图。

该图所示CM认识系统包括播放捕捉检索装置400、CM确认更新部500以及CM管理数据库群600。

播放捕捉检索装置400包括捕捉部410、检索部420、FM/AM·CM文件430、广播特征文件440、CM数据文件450、TV·CM数据文件460以及时刻数据提供部470。

捕捉部410就电视台、电台广播连续地监测广播数据,通过判定CM结束与开始来判定所监测广播数据是否为CM;若是CM,则将所监测CM数据存放于TV·CM数据文件460或存放于FM/AM·CM文件430。捕捉部410还根据时刻数据提供部470所提供的时刻信息对CM数据赋与时间标识。

进一步,捕捉部410还从所捕捉数据生成CM的特征数据而存放于广播特征文件440。后面将要提到,在生成广播特征文件440时,为了吸收由CM开始与结束点划分出的数据的切断点误差,还将数据再加工成一定长度(8.0秒)数据—自CM数据中心向两侧均等地延长而切断的数据。于是,利用学习活动检索技术所揭示的技术对该再加工后数据实行特征数据化而以TAZ格式存放。TAZ文件是在检索部420的学习活动检索上可以实行高速比较处理的文件。

检索部420,将广播特征文件440和CM管理数据库群600中的保存有CM特征的文件读入内存,进行两个文件的对照,将对照结果存放于CM数据文件450。须指出的是,假设检索部420采用学习活动检索(日本专利3065314号等)。这时,对于对照结果显示没有检索到CM者,将其CM数据以播放时间为名称保存于CM数据文件450。

捕捉部410所捕捉的FM/AM播放CM数据被当作WAV格式(只有语音的格式)文件保存在FM/AM·CM文件430。

广播特征文件440中保存从410所捕捉的CM数据抽出的CM特征数据。广播特征文件440是TAZ文件(二进制文件)。

捕捉部410所捕捉的电视播放CM数据被当作AVI格式文件保存在TV·CM数据文件460。

CM确认更新部500读取保存着CM名没有被判明的CM数据的CM数据文件450。由于CM数据文件450的CM为新CM的可能性大,所以操作者譬如利用Windows Media Player 7等软件进行新登记CM确认,抽出作广告者(委托客户)、商品名、乐曲名以及演员名等,存放于CM管理数据库群600的文件中。

CM管理数据库群600包括CM主文件610、商品主文件620、演员主文件630、乐曲名主文件640、作广告者主文件650、以及主CM内容物特征文件660。在CM确认更新部500抽出商品主文件620、演员主文件630、乐曲名主文件640、作广告者主文件650、以及主CM内容物特征文件660中的数据。这些主文件是按存放在CM主文件610中CM数据属性生成的主文件。

下面描述根据上述结构的动作。

图6及图7是本发明CM认识系统概要动作流程图。

步骤301:在播放捕捉检索装置400的捕捉部410,捕捉被播放的广播数据。

步骤302:检索部410从所捕捉广播数据检测出CM数据,按前述方法从CM数据抽出广播特征。

步骤303:将所抽出广播特征存放于广播特征文件440,进入步骤307。

步骤304、305:在上述处理同时,将电视CM存放于TV·CM数据文件460。

步骤306:若被抽出的CM是业已FM/AM播放过的CM时,还将该CM存放于FM/AM·CM文件430。

步骤307:在步骤303之后,检索部420将广播特征文件440和CM管理数据库群600的CM内容物特征文件660读取于内存,比较两个文件而行学习活动检索。

步骤308:当通过检索判明CM时转到步骤307,进行下个广播特征文件440数据与CM内容物特征文件660的检索。而当没有判明CM时则转到步骤309。

步骤309:没有判明CM时将播放时间作为名称登记于CM数据文件450。

步骤310:在CM确认更新部500,操作者利用现有软件等进行业已登记于CM数据文件450的CM的确认。

步骤311:由操作者进行CM主文件610维护,进一步,还从CM主文件610开始进行各属性主文件的维护。

这样,就可以将新CM登记到数据库里。

第三实施例

也可以象第一实施方案所示的从所认识乐曲生成时间序列播出单那样,从第二实施方案中所认识的CM生成时间序列播出单。

又,也可以象第二实施方案的CM例那样来更新有关乐曲的内容物特征文件、内容物信息数据库。

进一步,也可以一边象第一实施方案那样生成时间序列播出单一边象第二实施方案那样来更新有关CM或乐曲的内容物特征文件、内容物信息数据库。其具体例后述。

下面,根据附图描述对应于上述各实施方案的具体例。

对应于第一实施方案的具体例(第1具体例)

图8是本发明第1具体例的乐曲认识系统框图。

关于该图所示各装置,同图3所示结构一样者标注同一标号,并省略说明。

图9是本发明第1具体例的乐曲认识系统动作流程图。

下面根据图8及图9描述本发明乐曲认识系统。

如图8所示,在本乐曲认识系统中连接有:播放捕捉检索装置100—由实时地捕捉广播内容的PC110和检索广播特征文件140的PC120连接而成;和内容物生成装置300—具有对保持乐曲内容物特征的内容物特征文件320及内容物信息数据库330加以管理的PC310;以及乐曲确认登记装置200—将时间序列播出单登记于数据库。

图9所示处理系列A中,PC110捕捉播放内容(步骤201),从所捕捉数据以7.5秒间隔输出广播特征文件140(步骤202);接着,PC120利用从内容物生成装置300获取并预先在内存打开的内容物特征文件320的内容与广播特征文件140,以学习活动检索方式检索乐曲(步骤203),将检索结果输出至检索结果文件150(步骤205)。又,此时,若经检索没有判明乐曲,则将特征数据存放于乐曲名未抽出文件(步骤207)。

上述处理一完成,就会在乐曲确认登记装置200从检索结果文件150的检索结果和内容物信息数据库生成时间序列播出单而保存于数据库230。

在图9所示处理系列B中,播放捕捉检索装置100的PC110判定一下广播数据是否为乐曲(步骤301);若是乐曲则将向乐曲抽出文件130输出表明是乐曲的事项以及时间标识(步骤302)。又,乐曲本身也赋与时间标识而保存于图中省略的WAV文件等中。

这样,通过合并乐曲名未抽出文件160(处理系列A的)和乐曲抽出文件130(处理系列B的)就可以输出按时间分的乐曲未检出文件170(步骤208、209),可以通过操作者向检索结果文件150反馈。据此就可以补充时间序列播出单。

须指出的是,作为操作者的操作是:一边在进行检索的PC120上确认乐曲未检出文件的内容一边在检索结果文件150中补充所需数据项目。

还须指出的是,设上述内容物特征文件320、检索结果文件150采用TAZ文件(用于学习活动检索的二进制文件)。

在播出单生成方面要结合检索结果文件和包含CM主文件等的内容物信息数据库。关于其具体例,描述应用例于下。

须指出的是,在图8所示例子中,PC110对于全国各地广播内容可以通过从相应区域进行数据接收而作捕捉,进而进行广播特征文件生成等。也可以在全国各地配置PC110,各PC110捕捉当地广播内容而生成广播特征文件,然后将该广播特征文件发送给配置在中心的PC120。

下面描述本发明应用例。

图10是上述本发明具体例的应用例示意图。

该图中,内容物管理中心对应于图8所示内容物生成装置300。又,设数据中心对应于图8的播放捕捉检索装置100。

首先,在内容物管理中心,从唱盘公司得到试听CD等,从CD销售商店等购入DVD、新版CD等,根据这些存储介质将内容物连同内容物属性存放于内容物信息数据库330,而且还抽出内容物特征而存放于内容物特征文件320(在图10的例子中为乐曲数据库)。

接着,数据中心利用频道选择器获取譬如通过配置在全国各地的天线得到的(电视(VHS)或FM等广播内容、或者通过抛物面天线得到的卫星广播内容。在数据中心,以7.5秒间隔对所获取广播数据进行数码化处理,同时抽出数据特征而存放于广播特征文件140,而且还判别一下是乐曲还是讲话等非乐曲,继而将判别结果存放于乐曲抽出文件130。

在数据中心的检索用PC,以检索引擎(学习活动检索技术)从内容物管理中心预先获取的内容物特征文件以及广播特征文件检索乐曲而存放于检索结果文件150。

据此,在数据中心内的用做乐曲确认登记装置200的PC中,利用检索结果文件、内容物信息数据库330生成时间序列播出单。在图10的例子中,是按时刻(赋与检索结果文件的时间标识)顺序将乐曲名、作曲者、节目(CM)、委托客户、商品、演员、以及CD信息等作为时间序列播出单而登记于供网点(Web Site)用的数据库。又,对于不能检索出的乐曲,由操作者进行乐曲追加。

图11示出了制作时间序列播出单时所用的各个文件其及关系。

如该图所示,从广播特征文件和内容物特征文件生成检索结果文件和乐曲名未抽出文件。进而从检索结果文件和内容物信息数据库生成时间序列播出单。

另一方面,通过从乐曲抽出文件和乐曲名未抽出文件等生成乐曲未检出文件、并由操作者确认该文件记录的乐曲所对应的乐曲名等,可以补充时间序列播出单。又,对于乐曲名等得到确认的乐曲,可以视需要进行特征化处理,据此将之追加于内容物特征文件中。这样,当捕捉相当于TAZ4的乐曲时就可以认识该乐曲。

下面参考图12、13描述利用内容物信息数据库生成图10所示时间序列播出单的方法。

图12示意的是就播出单确定时刻9点时的各项目的示意图。如该图所示,内容物信息数据库包括始自TAZ数据而串联起来的各数据库(主数据库)。因此,只要从TAZ数据判明乐曲名,就可以通过自音源主文件开始逐一查找各主文件而获取时刻9点的各信息。另外,从广播台名和时刻还可以得知节目名。就这样,可以生成含有各种关联信息的时间序列播出单。

图13所示的是时刻11点46分时的情形,同上述一样,可以根据TAZ数据并利用各主文件来获取对应于该时刻的各种信息。

下面说明本发明乐曲认识系统模拟结果。该模拟以含有7首乐曲的实际FM广播录音(约35分)作广播取样;以CD乐曲193首作数据库取样,其中有6首含在上述广播取样中。

模拟条件设为:以7.5秒间隔将广播取样同所有193首乐曲对照(193首=20小时);PC服务器的规格—用1个CPU(Pentium Xeon933MHZ)、2GB内存、Linux gcc 291。

在上述条件下实施本发明方法模拟的结果显示:所有应检出的6首都被正确地检出;时间误差大致在7.5内;就速度而言,约45秒完成了35分(2100秒)长检索,即实际时间下速度的50倍(=2100/45),就是说若实际时间都占用的话则可处理大约9000首。

又,虽然上述实施例中是就图8、图9描述的,但是也可以把图9所示动作设计成程序,将之存放于同数据中心及内容物管理中心所用计算机连接的硬盘、软盘以及CD-ROM等可移动存储介质中,当实施本发明之际将其安装于数据中心及内容物管理中心所用计算机。据此可以容易地实现本发明。

对应于第二实施方案的具体例(第2具体例)

在此描述的是从被广播的广播数据实时地检出CM而加以认识保存之例。通过将这样保存的CM数据用作上述主文件,可以生成含CM关联信息的时间序列播出单。

图14是本发明第2实施例的CM认识系统框图。

关于该图所示构成要素,同图5所示结构一样者标注同一标号,并省略说明。

本实施例的CM认识系统包括:播放捕捉检索装置400—由捕捉广播内容的捕捉PC410和比较广播特征文件440与CM内容物特征文件660的学习活动检索PC420;和CM确认更新部500—参照学习活动检索PC420输出的CM数据450进行CM确认及更新处理;以及CM管理数据库群600—管理CM的各主文件。

在此说明一下图14中的文件格式。

广播特征文件440是存放实时抽出的TV·CM及FM/AM·CM两者特征的TAZ格式文件。

TV·CM数据文件460是存放TV·CM的AVI格式文件,其被同广播特征文件440内容成对地管理。

FM/AM·CM文件430是存放FM/AM·CM的WAV格式文件,其被同广播特征文件440内容成对地管理。

CM数据文件450是存放应新登记的CM的文件,当为TV·CM时数据譬如以AVI格式存放,而当为FM/AM·CM时数据譬如以WAV格式存放。

CM管理数据库群600的主CM内容物特征文件660以TAZ格式存放。

下面参照上述过的图6、7描述以上结构下之动作。

捕捉部410捕捉播放内容(步骤301)。然后,捕捉PC410靠CM检测模块获取CM的开始和结束点。该CM检测内部模块可见于特愿平6-312976”图像切断点检测方法及装置”(谷村·外村)等。

接着,为了吸收由CM检测模块所切出数据的切断点误差,还如图15所示,将切出数据再加工成一定长度(8.0秒)数据—自CM数据中心向两侧均等地延长而切断的数据,将其作为广播特征抽出(步骤302)而存放于广播特征文件440(步骤303)。

捕捉PC410,当靠CM检测模块切断的播放数据为TV数据时将之以AVI格式存放,播放数据为FM/AM数据时将之以WAV格式存放(步骤304、305以及306)。

接着,学习活动检索PC420将广播特征文件440以及CM管理数据库群600的主CM内容物特征文件660读入内存,进行学习活动检索(步骤307)。在此,若CM在CM内容物特征文件660没有登记则将之登记于CM数据文件450(步骤309),而且若在CM内容物特征文件660没有登记时还将该CM无条件地登记于主CM内容物特征文件660。

接着,在CM确认更新部500进行业已登记于CM数据文件450的CM之确认(步骤310)。CM确认处理利用现有软件进行。又,通过靠操作者追加各种最终附加信息来将该CM登记于CM主文件610。进一步,还根据业已登记于CM主文件610的CM的属性,以对应数据更新商品主文件620、演员主文件630、乐曲名主文件640、作广告者主文件650、以及主CM内容物特征文件660(步骤311)。

又,虽然上述实施例中是就图6、图7所示流程描述的,但是也可以把图6所示动作设计成程序,将之存放于同播放捕捉检索装置所用计算机连接的硬盘、软盘以及CD-ROM等可移动存储介质中,当实施本发明之际将其安装于播放捕捉检索装置所用计算机(捕捉PC、学习活动检索PC)。据此可以容易地实现本发明。

在上述实施例中,虽然所示出的对TV、FM/AM等广播台播放的广播数据进行捕捉而加以认识保存的处理,但是并非仅限于此例,对于通过因特网等通信网络传送的数据也可以应用和上述一样的处理。

须指出的是,在上述实施例中示出的对乐曲以7.5秒、对CM以8秒间隔进行特征化的例子不过只是一例而已,并非限定于此。

对应于第三实施方案的具体例(第3具体例)

在此描述的是通过捕捉乐曲、CM而如第一实施例那样生成播出单、同时如第二实施例那样登记内容物生成部中数据之例。

图16示出了本发明第3具体例的系统结构。

如该图所示,本第3具体例的乐曲CM认识系统包括:播放捕捉检索装置700—捕捉广播内容、进行乐曲及CM检索;和内容物生成装置800—生成内容信息数据库;以及CM确认登记装置900—从检索结果文件及内容信息数据库生成时间序列播出单,而且将被新确认乐曲或CM的属性信息登记于内容物生成装置800。

播放捕捉检索装置700包括播放捕捉部710、检索部720、乐曲CM抽出文件730、广播特征文件740、检索结果文件750、乐曲·CM未抽出文件760、乐曲·CM未检出文件770、以及内容物特征文件生成部780。内容生成装置包括内容物生成部810、内容物特征文件820、以及内容物信息数据库830。

图17是图16所示系统概要动作流程图。参照图17描述动作概要。

首先在内容物生成装置800抽出乐曲、CM的特征而作为内容特征文件保存(步骤401)。在播放捕捉检索装置700,播放捕捉部710捕捉含有乐曲、CM的广播内容物作为AVI文件、WAV文件等保存,同时还抽出内容物特征而保存于广播特征文件740(步骤402)。接着,利用内容物特征文件820与广播特征文件740检索乐曲、CM(步骤403)。于是,当乐曲或CM被判明时,将乐曲或CM有关信息保存于检索结果文件(步骤404),生成时间序列播出单(步骤405)。而当乐曲或CM没有判明时,将没被判明乐曲或CM的特征数据等保存于乐曲·CM未抽出文件(步骤406),生成对应于该乐曲、CM的内容物特征文件,自动登记于内容物生成装置800的内容物特征文件820(步骤407)。

下面以图18所示播放捕捉检索装置700的处理流程图进一步详述以上处理。

如图8所示,本实施例中播放捕捉检索装置700的处理可以分为:进行乐曲、CM检索的处理系列1;和进行乐曲检索、乐曲判别、保存的处理系列2;以及进行CM检出、保存的处理系列3。

在处理系列2,同第一实施例一样,判定广播内容是否为乐曲,生成乐曲抽出文件,而且还将乐曲数据作为WAV文件等保存起来(步骤501-503)。乐曲数据保存方法见图9。这样,每隔7.5秒即将被判定为乐曲的部分保存起来。

在处理系列3,同第二实施例一样,通过检测广播切断点生成CM抽出文件,而且还将CM数据作为AVI文件等保存起来(步骤511-513)。其处理情形见图20。这样,就将切断点间的CM部分保存了起来。

须指出的是,CM抽出文件是象乐曲方面的乐曲抽出文件那样的文件,记录有表明是CM的事项和其时间。

在处理系列1,就乐曲而言同第一实施例一样,就CM而言则同第二实施例一样,进行特征抽出、乐曲或CM检索(步骤521、522)。

在判明了乐曲或CM名的场合,生成检索结果文件750(步骤523)。而在没有判明乐曲或CM名的场合,则将数据存放于CM未抽出文件(步骤524),利用该数据自动生成内容物特征文件(步骤525),假登记于内容特征文件520。

图21示出了从乐曲·CM未抽出文件生成内容物特征文件的处理。若此,从对应于乐曲·CM未抽出文件中数据的乐曲、CM的数据文件(AVI或WAV)生成内容物特征文件。

又,象第一实施例那样,从乐曲·CM未抽出文件与乐曲CM抽出文件等生成乐曲·CM未检出文件(步骤526),由操作者确认乐曲、CM,以被确认乐曲、CM来进行时间序列播出单补充(步骤527)。进一步,还利用确认结果进行内容物生成装置中各数据库更新(将TAZ文件与乐曲名、作曲者等关联起来),据此将假登记内容物特征文件转为正式登记(步骤528)。

通过进行这样的处理,可以一边进行时间序列播出单生成一边进行以时间序列播出单为基础的内容物特征文件的数据追加、以及乐曲或CM关联信息的登记。

如上所述,根据实时认识乐曲的本发明,以7.5秒间隔对播放的广播数据(CM所用乐曲等)加以数码化、特征化,同预先准备的乐曲的内容特征文件进行对照,能以被广播的时刻信息连同乐曲名作为时间序列播出单保存于存储装置上。据此,可以获取乐曲名、作曲者、节目(CM)、委托客户、商品、演员、以及CD信息等的按时刻分的播出单,可以获取有意义的信息结果。这些可以被销售对象活用于市场信息等。

须指出的是,之所以用7.5秒间隔进行数码化特征化,是由于目前一般CM广播时间最短是15秒,为切实地进行检索而取其一半时间。故,视内容物种类而将数码化间隔时间变更为其它值也有效,并非一定是7.5秒。

又,根据本发明,对于已往由人工进行的CM监测作业可以实时地自动认识,即便没有标志信息或透明信息等也照样可以实时登记TV以及FM/AM播放的CM数据。进而,还可以将此CM数据用于生成时间序列播出单。

又,根据本发明,在生成时间序列播出单过程中,由于对于乐曲名没被判明的数据可以自动登记于内容物生成装置,所以可以充实内容物生成装置中数据库数据,可以生成更高精度的时间序列播出单。

本发明并非仅限于上述实施例,在不脱离本发明范围情况下可以进行种种变形应用。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号