首页> 中国专利> 回放装置、设置装置、回放方法及程序

回放装置、设置装置、回放方法及程序

摘要

一种回放装置包括:获取单元,获取包括要被作为说话语音来回放的数据在内的听觉语言数据;分析单元,分析听觉语言数据以输出分析结果;设置单元,基于分析结果,将听觉语言数据的至少一部分设置为要以所设置的回放速度来回放的控制部分;以及语音回放单元,以所设置的回放速度来回放作为说话语音的控制部分。

著录项

  • 公开/公告号CN104756181A

    专利类型发明专利

  • 公开/公告日2015-07-01

    原文格式PDF

  • 申请/专利权人 NEC卡西欧移动通信株式会社;

    申请/专利号CN201380055758.9

  • 发明设计人 北谷谦一;

    申请日2013-10-11

  • 分类号

  • 代理机构中科专利商标代理有限责任公司;

  • 代理人王波波

  • 地址 日本神奈川

  • 入库时间 2023-12-18 09:48:08

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-10-27

    授权

    授权

  • 2015-07-29

    著录事项变更 IPC(主分类):G10L13/10 变更前: 变更后: 申请日:20131011

    著录事项变更

  • 2015-07-29

    专利申请权的转移 IPC(主分类):G10L13/10 变更前: 变更后: 登记生效日:20150710 申请日:20131011

    专利申请权、专利权的转移

  • 2015-07-29

    实质审查的生效 IPC(主分类):G10L13/10 申请日:20131011

    实质审查的生效

  • 2015-07-01

    公开

    公开

说明书

技术领域

本发明涉及用于回放听觉语言数据的回放装置、对回放速度受到 控制的部分进行设置的设置装置、回放方法及程序。

背景技术

作为信息媒体,已经存在很多使用视觉信息传输手段(例如文本、 图和照片)的视觉信息媒体(以视觉方式提供信息的信息媒体),例如, 书、报纸和网页。

在观看视觉信息媒体的情况下,用户(使用信息媒体的人)可以 执行对以二维方式布置的信息的拣选。因此,用户在相对短的时间内 掌握所需信息。例如,通过扫视报纸的页面并选择所需文章,用户可 以仅详细阅读选定的文章。

例如,在走路或者驾驶机动车的情况下,必须使用人的视觉来确 认周围的环境。因此,无法注视视觉信息媒体或者不应该注视视觉信 息媒体。这样,存在很多不合适使用视觉信息媒体的情况。

在不适合使用视觉信息媒体的情况下,可想到让用户通过使用听 觉信息媒体(以听觉方式提供信息的信息媒体)来掌握信息,例如音 频播放器。具体来说,通过输出包括语音在内的声音的听觉信息媒体, 可以向用户提供很多信息。这里,语音是指语言的声音。

已经提供了很多有关听觉信息提供的技术。

例如,专利文献1公开了延长语音和非语音输出时长的技术,其 目的是让语音回放与正常语音回放相比具有更缓慢的感觉。

专利文献2公开了用于在语音数据回放期间逐单位语音数据来改 变语音数据的回放条件的技术。

[现有技术文献]

[专利文献]

[专利文献1]日本专利公开JP 2009-075280

[专利文献2]日本专利公开JP 2007-219141

发明内容

本发明要解决的问题

与视觉显示(例如文本、图、照片)不同,声音输出是在时间上 执行的。因此,当听觉信息媒体提供信息时,需要一些时间量。

例如,音频播放器回放的音频数据的回放速度一般是指定的。在 音频播放器根据该回放速度将音频数据从开始回放到结束的情况下, 需要被规定为该音频数据的回放时间的预定时间。如果音频播放器使 回放时间加速,则该音频数据回放所需要的时间变短。然而,让用户 能够掌握信息的回放速度是有限制的。具体来说,对于回放音频中包 括语音的情况,当回放速度加快时,用户将听不到语音中所讲的话。

这样,由于声音输出是在时间上执行的,即使在用户掌握听觉信 息媒体提供的的信息输出以执行信息拣选时,也需要时间。

作为一个示例,将描述用户要从未知内容的音频数据中掌握信息 的情况(例如,用户第一次收听的音频数据)。在这个情况下,为了检 测包括所需信息的位置,或者为了首先判断是否包括所需信息,容易 想到在掌握该信息的同时,从开始到结束地收听该音频数据。在该情 况下,如上文所述,让用户能够掌握信息的回放速度是有限制的。因 此,使收听数据所需要的时间缩短是有限制的。这里提到的音频数据 的内容是指音频数据示出的信息。

专利文献1中公开的技术是用于在例如增加语音的回放速度时以 强烈的缓慢感对语音进行回放的技术。也就是说,专利文献1中公开 的技术不是用于改变回放所需时间的技术。从这一点上说,在专利文 献1公开的技术中,用户无法通过在更短时间内掌握听觉信息媒体提 供的信息的概要来执行信息拣选。

在专利文献2公开的技术中,为了改变语音数据的回放速度,必 须提前为每个单位语音数据(例如每一个单词)设置控制数据,或者 提前在单词表中注册单词。为了执行对控制数据的设置或者对单词的 注册,用户需要提前掌握语音数据的内容。因此,在专利文献2公开 的技术中,用户无法通过在更短时间内掌握听觉信息媒体提供的信息 的概要来执行信息拣选。

本发明的示例目的在于:提供能够解决上述问题的回放装置、设 置装置、回放方法及程序。

解决问题的手段

一种根据本发明的示例方案的回放装置包括:获取单元,获取包 括要被作为说话语音来回放的数据在内的听觉语言数据;分析单元, 分析所述听觉语言数据以输出分析结果;设置单元,基于所述分析结 果,将所述听觉语言数据的至少一部分设置为要以所设置的回放速度 来回放的控制部分;以及语音回放单元,以所设置的回放速度来回放 作为说话语音的所述控制部分。

一种根据本发明的示例方案的设置装置包括:获取单元,获取包 括要被作为说话语音来回放的数据在内的听觉语言数据;分析单元, 分析所述听觉语言数据以输出分析结果;以及设置单元,基于所述分 析结果,将所述听觉语言数据的至少一部分设置为要以所设置的回放 速度来回放的控制部分。

一种根据本发明的示例方案的回放方法包括:获取包括要被作为 说话语音来回放的数据在内的听觉语言数据;分析所述听觉语言数据 以输出分析结果;基于所述分析结果,将所述听觉语言数据的至少一 部分设置为要以所设置的回放速度来回放的控制部分;以及以所设置 的回放速度来回放作为说话语音的所述控制部分。

一种根据本发明的示例方案的程序使计算机执行:获取包括要被 作为说话语音来回放的数据在内的听觉语言数据;分析所述听觉语言 数据以输出分析结果;基于所述分析结果,将所述听觉语言数据的至 少一部分设置为要以所设置的回放速度来回放的控制部分;以及以所 设置的回放速度来回放作为说话语音的所述控制部分。

本发明的效果

根据本发明的示例实施例,用户可以在更短的时间内对未知内容 的声音数据中包括的信息进行拣选。

附图说明

图1是示出了本发明示例实施例中的听觉语言数据回放装置的功 能配置的示意框图。

图2是示出了在本发明示例实施例中基于用户操作来改变回放速 度的语音回放单元的示例的说明图。

图3是示出了在本发明示例实施例中根据回放速度控制部分的设 置来改变回放速度的语音回放单元的示例的说明图。

图4A是示出了在本发明示例实施例中针对听觉语言数据的每一 类型的用于回放速度控制部分的设置规则的示例的说明图。

图4B是示出了在本发明示例实施例中针对听觉语言数据的每一 类型的用于回放速度控制部分的设置规则的示例的说明图。

图4C是示出了在本发明示例实施例中针对听觉语言数据的每一 类型的用于回放速度控制部分的设置规则的示例的说明图。

图5是示出了在本发明示例实施例中当听觉语言数据回放装置对 向听觉语言数据设置的回放速度控制部分执行回放时的处理过程的流 程图。

图6是示出了本发明另一示例实施例中的听觉语言数据回放装置 的主要单元的示意框图。

图7是示出了在本发明又一示例实施例中的回放速度控制部分设 置装置的功能构成的示意框图。

具体实施方式

以下将描述本发明的示例实施例。图1是示出了本发明示例实施 例中的听觉语言数据回放装置的功能配置的示意框图。图1中,听觉 语言数据回放装置(以下有时简称为“回放装置”)100包括通信单元 110、听觉语言数据获取单元(以下有时简称为“获取单元”)120、显 示单元130、语音回放单元140、操作输入单元150和控制单元190。 获取单元120包括存储设备121。控制单元190包括通信控制单元191、 分析单元192、显示控制单元193、回放速度控制部分设置单元(以下 有时简称为“设置单元”)194、用户指令检测单元(以下有时简称为“检 测单元”)195和应用执行单元196。

回放装置100回放听觉语言数据,并输出说话语音。听觉语言数 据是可以被作为说话语音来回放的数据。听觉语言数据可以包括指示 说话语音的声音数据以及句子数据(例如文本数据或单词处理器数据) 这里的说话语音是一种作为语言听觉表达的声音。回放装置100输出 的说话语音可以是人发出的语音录音中包括的语音或者合成语音。

回放装置100的用户(以下简称为“用户”)通过收听回放装置100 输出的说话语音来获取信息。

以下,作为示例,将描述回放装置100是便携式终端设备(便携 式电话或智能电话)的情况。然而,本发明的应用范围并不限于便携 式终端装置。回放装置100可以是能够回放听觉语言数据的音频播放 器、游戏机、个人计算机(PC)或个人数字助理(PDA)。

通信单元110通过连接到移动电话网络(即通信运营商向移动终 端设备提供的通信网络)来执行通信。

获取单元120获取听觉语言数据。具体来说,获取单元120所包 括的存储设备121存储听觉语言数据。通过从存储设备121读出听觉 语言数据,获取单元120获取听觉语言数据。

获取单元120获取听觉语言数据的方法不限于从存储设备121读 出听觉语言数据的方法。作为这种方法,能够使用各种以允许回放速 度改变的方式来获取听觉语言数据的方法。例如,获取单元120可连 接到外部存储设备,并从该外部存储设备读出听觉语言数据。

语音回放单元140具有扬声器并输出声音。具体来说,语音回放 单元140通过根据设置单元194的设置回放听觉语言数据,来输出说 话语音。设置单元194在听觉语言数据中设置回放速度控制部分(以 下有时简称为“控制部分”)。该控制部分表示应当根据和回放速度有关 的预定控制规则来回放的部分。

在回放听觉语言数据时,语音回放单元140根据和回放速度有关 的预定控制规则来回放被设置为控制部分的部分。语音回放单元140 以与用户指令相对应的回放速度来回放听觉语言数据中没有被设置为 控制部分的部分。

可以应用各种控制规则,作为与回放速度有关的预定控制规则。 例如,应用于控制部分的控制规则可以是以预定回放速度进行回放的 规则,或者可以是应当以用户所指示回放速度的一半的回放速度来执 行回放的规则。

参照图2和图3,将给出语音回放单元140回放听觉语言数据所 用的回放速度的描述。

图2是示出了语音回放单元140基于用户操作来改变回放速度的 示例的说明图。图2示出了控制部分没有被设置的情况的示例。

图2的(A)部分示出了对听觉语言数据的回放速度进行设置的 示例。图2的(A)部分中,听觉语言数据被分成单元A至F。为每 一个单元设置回放速度。

这里,单元是基于语言学含义对听觉语言数据分割的组。可以使 用各种级别的单词单元作为单元,例如单词、短语、句子或段落。也 可以使用除了单词单元之外的单元作为单元,例如,将两个句子用作 单个单元,或者将听觉语言数据在每一个给定的时间分割为单元。

这里设置的回放速度指示用作标准的回放速度。当指示以标准速 度回放时(以下称为“标准回放”),语音回放单元140以作为标准的该 回放速度执行回放。在图2的示例中,作为初始设置,针对单元A至 F中的每一个设置相同的回放速度。从附图标记H到每一个单元A至 F的连线示出了针对每一个单元设置回放速度。

设置听觉语言数据的回放速度的方法不限于如图2的(A)部分 所示的执行针对每一个单元的设置的方法。可以使用能够在语音回放 单元140以标准速度回放听觉语言数据时获取回放速度的各种方法, 作为对听觉语言数据的回放速度进行设置的方法。例如,在听觉语言 数据是声音数据的情况下,整个听觉语言数据的回放速度可以由该声 音数据的标准来指示。在听觉语言数据是句子数据的情况下,在语音 回放单元140所执行的读出句子数据的功能中,可以设置对于每一个 句子数据来说共同的标准朗读速度。

图2的(B)部分示出了在回放听觉语言数据时的回放速度的示 例。在图2的(B)部分,以与用户操作相对应的回放速度来回放每 一个单元。在用户操作的示例中,包括“正常收听”和“半收听”。“正常 收听”是指示标准回放的用户操作。此外,“半收听”是指示高速回放的 用户操作。这里,高速收听是指示以比标准回放期间更快的指定回放 速度(例如标准回放速度的三倍)进行回放的用户操作。图2的(B) 部分中,附图标记J1和J3示出了用户已针对单元A、B、E和F设置 了“半收听”。附图标记J2示出了用户通过回放期间的设置改变已针对 单元C和D设置了“正常收听”。图2的(B)部分中,附图标记I1示 出了已针对单元A和B设置了高速回放(语音小)。附图标记I2示出 了通过回放期间的设置改变已针对单元C和D设置了标准回放(语音 大)。附图标记I3表示已针对单元E和F设置了高速回放(语音小)。

通过“半收听”的用户操作对高速回放进行选择,用户使回放装置 100在更短的时间内回放全部听觉语言数据,以能够检测包括所需信 息的位置。已检测到包括所需信息的位置的用户通过使回放装置100 以标准速度回放该位置,来获得所需信息。

在图2的示例的情况下,回放装置100从初始单元A开始顺序高 速回放听觉语言数据。已经收听了对单元C进行回放的说话语音的用 户通过识别出单元C是包括所需信息的位置,向回放装置100指示标 准回放。图2示例中的用户指示回放装置100对单元C和单元D执行 标准回放,从而可以从这些单元中获取信息。

在检测单元195检测到降低回放速度的用户指令时,语音回放单 元140使回放位置从当前回放位置回退,并且从回退后的位置起以降 低的回放速度开始听觉语言数据的回放。更具体地,在检测单元195 检测到降低回放速度的用户指令时,语音回放单元140将回放位置回 退到包括当前回放位置的单元的开头。此外,语音回放单元140从该 单元的开头起以降低的回放速度开始听觉语言数据的回放。

例如,在图2的(B)部分示出的示例中,在单元C的高速回放 期间,通过向操作输入单元150输入“正常收听”指令,用户指示标准 回放。响应于该指令,语音回放单元140使回放位置回退到单元C的 开头,并且从单元C的开头起执行标准回放。

已经通过收听以高速回放单元C的说话语音而确定所需信息被包 含在单元C中的用户之后通常将指示在单元C的中间进行标准回放。 然而,在语音回放单元140执行从单元的中间开始进行标准回放的情 况下,例如从句子的中间或者单词的中间,用户无法获取所需信息。

因此,语音回放单元140使回放位置回退到单元的开头,并从该 单元的开头起执行标准回放。因此,用户容易地获取所需信息。

作为另一方法,还可以按以下方式执行回放。即,当检测单元195 检测到降低回放速度的用户指令时,语音回放单元140使回放位置回 退,甚至回溯到在包括当前回放位置在内的单元的开头之前的位置。 此外,语音回放单元140从回溯位置起以降低的回放速度来回放听觉 语言数据。

这里,回溯位置指示在整个听觉语言数据被连续回放的情况下在 较早的时间处被回放的位置。

将参考图2的(B)部分来描述具体示例。在单元C的高速回放 期间,操作输入单元150从用户接收“正常收听”指令。响应于该指令, 检测单元195检测标准回放。然后,语音回放单元140使回放位置回 退到单元B的中间的位置,后退到单元C开始之前的预定时间(例如 标准回放期间的5秒)。此外,语音回放单元140从单元B中间的该 位置起执行听觉语言数据的标准回放。

因而,用户可以掌握包括所需信息的单元(例如单元C)和前一 单元(例如单元B)在内的单元之间的关系,且因此更容易获取所需 信息。

然而,语音回放单元140将回放位置回退、然后以降低的回放速 度来回放听觉语言数据的处理不是必须的。因此,当执行降低回放速 度的用户指令时,语音回放单元140还可以降低回放速度以照现在的 样子执行回放(例如执行标准回放),但不执行回放位置的回退。

图2的(B)部分的示例中,语音回放单元140以相对较高的音 量执行标准回放,并以相对较低的音量执行高速回放。相对较高的音 量是比标准音量更大的音量。相对较低的音量是比标准音量更小的音 量。

因而,当用户通过使回放装置100执行听觉语言数据的高速回放 来搜索包括所需信息的位置时,可以降低回放所产生的语音刺激用户 或周边其他人的耳朵的风险。此外,通过语音回放单元140以相对较 高的音量来执行对包括用户所需信息的位置的回放,用户容易地获取 所需信息。

然而,语音回放单元140以相对较高的音量执行标准回放以及以 相对较低的音量执行高速回放的处理不是必须的。语音回放单元140 还可以以相同的音量执行标准回放和高速回放。

作为另一方法,语音回放单元140还可以用比标准回放期间更大 的音量来执行高速回放。因而,在高速回放期间,用户可以容易地检 测包括所需信息的位置。

图3是示出了语音回放单元140根据控制部分的设置来改变回放 速度的示例的说明图。

图3的(A)部分示出了听觉语言数据的回放速度和控制部分的 设置示例。

在图3的(A)部分中,听觉语言数据被分为单元A至F,并且 针对每一个单元来设置回放速度。此外,单元D被设置为控制部分。 从附图标记H到单元A至F的连线示出了针对每一个单元来设置回放 速度。附图标记L示出了单元D被设置为控制部分。

在图3的示例中,控制部分指示应当以标准速度回放的部分。

图3的(B)部分示出了在回放听觉语言数据时的回放速度的示 例。在图3的(B)部分中,通过执行“半收听”的用户操作,用户指 示高速回放。然后,响应于该指令,语音回放单元140执行单元A至 C以及单元E至F的高速回放。相反,针对被设置为控制部分的单元 D,语音回放单元140根据设置执行标准回放。在图3的(B)部分中, 附图标记N示出了用户针对单元A至F设置“半收听”。

在图3的(B)部分中,附图标记M1和M3指示针对单元A至C、 E和F设置高速回放(低音量)。附图标记M2示出了针对单元D设 置标准回放(高音量)。

如下文所描述的,分析单元192分析听觉语言数据,并且基于分 析结果,设置单元194将听觉语言数据的各单元中高重要可能性的部 分设置为控制部分。因而,语音回放单元140以相对较慢的速度重播 听觉语言数据的重要部分(在图3的示例中,以标准速度回放重要部 分)。因此,用户可以容易地获取所需信息。

另一方面,语音回放单元140以与用户指令相对应的速度回放没 有被设置为控制部分的部分。因此,通过用户指示更快的回放(图3 示例中的高速回放),能够缩短整个听觉语言数据的回放时间。

因此,用户可以用更短的时间对未知内容的声音数据中包含的信 息执行拣选。

语音回放单元140增加控制部分的回放音量。在图3的(B)部 分的示例中,语音回放单元140以相对较高的音量执行控制部分的回 放。另一方面,语音回放单元140以相对较低的音量执行除控制部分 之外的部分的回放。

因而,语音回放单元140执行除控制部分之外的部分的高速回放。 因此,当用户判断在除控制部分之外的部分中是否存在所需信息时, 可以降低回放的语音刺激用户和周边其他人的耳朵的风险。此外,语 音回放单元140以相对较高的音量执行控制部分的回放。因此,用户 容易获取所需信息。

然而,语音回放单元140以相对较高的音量执行控制部分的回放 以及以相对较低的音量执行除控制部分之外的部分的回放的处理不是 必须的。语音回放单元140可以用相同的音量执行控制部分及其他部 分的回放。

作为另一方法,还可以让语音回放单元140以比控制部分的回放 期间更高的音量来执行除控制部分之外的部分的回放。因而,在执行 除控制部分之外的部分的高速回放时,用户可以容易地检测包括所需 信息的位置。

将要描述语音回放单元140以预定音量(相对较高的音量或者相 对较低的音量)来回放控制部分的情况。在该情况下,可以使语音回 放单元140以恒定的音量回放除控制部分之外的部分。作为另一方法, 可以使语音回放单元140根据用户指示的回放速度来改变音量。

在上文中,给出了针对语音回放单元140以相对较低的速度来回 放控制部分的情况的描述(图3示例中的标准回放),但是不限于该情 况。可以使语音回放单元140以相对较高的速度回放控制部分(图3 示例中的高速回放)。

例如,设置单元194将听觉语言数据的单元中相对较低重要可能 性的部分设置为控制部分。因而,当用户收听说话语音的听觉语言数 据时,语音回放单元140可以用相对较高的速度回放相对较低重要可 能性的部分。通过以这种方式执行回放,能够缩短整个听觉语言数据 的回放时间。

另一方面,针对没有被设置为作为较高重要可能性的部分的控制 部分的部分,语音回放单元140以与用户指令相对应的回放速度来执 行回放。因而,通过使较高重要可能性部分中被判断为包括所需信息 在内的部分以相对较低的速度进行回放(图3示例中的标准回放),用 户可以获取所需信息。

回到图1,将继续描述。显示单元130可以具有显示屏,例如液 晶面板或有机EL(有机电致发光)面板。显示单元130显示各种图像, 例如运动图像、静止图像及文本(即字符)。具体来说,显示单元130 以可滚动的方式通过文本来显示听觉语言数据。此外,显示单元130 执行显示滚动,以便通过文本来显示听觉语言数据中由语音回放单元 140正在回放的部分。

因而,用户还可以通过视觉来确认语音回放单元140正在回放的 听觉语言数据。例如,即使在因环境噪声等影响而无法听到语音回放 单元140回放的听觉语言数据的情况下,用户仍可以通过在显示单元 130中显示的文本来确认。

此外,用户可以通过语音回放单元140输出的说话语音来确认听 觉语言数据的内容。因此,能够获取所需信息,而不用连续地观看显 示单元130。

然而,显示单元130以可滚动方式通过文本来显示听觉语言数据 不是必须的。例如,可以在不包括显示单元130的情况下构成回放装 置100。

操作输入单元150可以具有输入设备,例如构成触摸面板的触摸 传感器,其中触摸面板设置在例如显示单元130的显示屏中。操作输 入单元150接收用户操作。

控制单元190通过控制回放装置100的每个单元来执行各种功能。 控制单元190可以通过例如回放装置100所具有的CPU(中央处理单 元)从回放装置100所具有的存储设备中读出程序并执行该程序来实 现。

通信控制单元191控制通信单元110,以使通信单元110执行通 信。

显示控制单元193控制显示单元130,以使显示单元130显示各 种图像。

应用执行单元196执行各种应用程序。

检测单元195检测操作输入单元150接收的用户操作。具体来说, 检测单元195检测关于回放速度的用户指令。

能够使用各种操作作为指示回放速度的用户操作。例如,操作输 入单元150可以具有针对每个回放速度的输入键(按钮或者在屏幕上 显示的图标)或者用于增加/降低回放速度的输入键。检测单元195可 以将这些输入键上的按键操作检测为指示回放速度的用户操作。

作为另一方法,操作输入单元150可以具有用于切换回放速度的 拨盘开关(dial switch)。检测单元195可以将拨盘开关上的拨动操作 检测为指示回放速度的用户操作。

作为另一方法,显示单元130可以显示在整个听觉语言数据的回 放时间中示出当前回放位置的滚动条或者滑块开关。检测单元195可 以将滚动条或者滑块开关上的触摸操作(滚动操作或滑块操作)检测 为指示回放速度的用户操作。

具体来说,将描述显示单元130通过文本来滚动显示听觉语言数 据并执行显示的滚动以便显示语音回放单元140正在回放的部分的情 况。在该情况下,检测单元195可以将显示单元130的显示上的滚动 操作检测为关于回放速度的用户操作。

因而,用户不需要在显示单元130的显示上分别执行滚动操作以 及指示回放速度的用户操作。从这一点来说,能够节省用户的时间和 精力。

然而,检测单元195检测关于回放速度的用户指令的处理不是必 须的。例如,可以在不包括检测单元195的情况下构成回放装置100。 在该情况下,语音回放单元140以与控制部分的设置相对应的回放速 度来执行听觉语言数据的回放。具体来说,在该情况下,语音回放单 元140可以用标准速度来回放控制部分,并且可以执行没有被设置为 控制部分的部分的高速回放。

分析单元192对获取单元120所获取的听觉语言数据进行分析。 作为分析单元192执行的分析,能够使用各种分析。例如,分析单元 192可以执行对听觉语言数据的语言分析(例如,所使用语言的分析、 语法分析、等等)。分析单元192可以分析是否存在语音。

作为另一方法,分析单元192可以分析语音的强度。分析单元192 还可以分析语音的音高。此外,分析单元192可以执行多种分析,例 如分析语音的强度和语音的音高。具体来说,将描述分析单元192执 行对听觉语言数据的语法分析的情况。在该情况下,分析单元192可 以基于解析结果将听觉语言数据分割为句子单元,例如单词、短语、 句子或者段落,并且可以使每个分割形成听觉语言数据的单元。

以下,作为示例,将描述分析单元192分析听觉语言数据的类型 的情况。

例如,分析单元192执行对听觉语言数据的语言的确定,例如语 言是英语还是日语,作为对听觉语言数据的类型的分析。此外,分析 单元192执行对听觉语言数据的意图目的的确定,作为对听觉语言数 据的类型的分析。在听觉语言数据的意图目的中,可以包括针对社交 网络服务(SNS)的发帖、报纸或杂志中的文章、诸如电子邮件之类 的消息。

分析单元192可以基于使用听觉语言数据的应用程序来确定听觉 语言数据的类型。

以下给出具体示例。将要给出针对应用执行单元196执行移动浏 览器应用程序(用于移动设备(例如移动终端设备)的网络浏览器) 以连接SNS站点的情况的描述。在该情况下,分析单元192确定,应 用执行单元196已获取并存储在存储设备121中的听觉语言数据是 SNS发帖。

将要给出针对应用执行单元196执行移动浏览器应用程序以连接 用于查看报纸文章的站点的情况的描述。在该情况下,分析单元192 确定应用执行单元196已获取并存储在存储设备121中的听觉语言数 据是报纸文章。

将要给出针对应用执行单元196执行移动浏览器应用程序以连接 除SNS或文章之外的网站的情况的描述。在该情况下,分析单元192 确定应用执行单元196已获取并存储在存储设备121中的听觉语言数 据是网页。

将要给出针对应用执行单元196执行电子邮件应用程序的情况的 描述。在该情况下,分析单元192确定应用执行单元196已获取并存 储在存储设备121中的听觉语言数据是电子邮件消息。

作为另一方法,基于除使用应用语言数据的应用程序之外的信息, 分析单元192可以确定听觉语言数据的类型。作为具体示例,分析单 元192可以分析听觉语言数据的格式,以确定听觉语言数据的类型。

设置单元194基于分析单元192的分析结果在听觉语言数据中设 置控制部分。例如,设置单元194基于听觉语言数据的类型来执行控 制部分的设置。

图4A至4C是示出了针对听觉语言数据的每一类型的控制部分设 置规则的示例的说明图。

在图4A至4C中,附图标记h指示开始。附图标记e指示结束。

基于图4A至4C中示出的设置规则,设置单元194设置控制部分。

针对英语听觉语言数据,设置单元194设置控制部分,使得句子 开头的回放速度是相对较低的速度。例如,在控制部分指示执行标准 回放的部分的情况下,设置单元194将位于句子开头处的单元设置为 控制部分。因而,避免高速回放位于句子开头处的单元。

在图4A中,附图标记O1指示作为针对英语的设置规则的回放速 度优选为“慢”的部分。附图标记O2指示作为针对英语的设置规则的 回放速度优选为“快”的部分。

在英语句子中,重要内容经常被包含在句子的开头。因此,例如, 通过设置单元194将控制部分设置为位于句子开头的单元,语音回放 单元140以相对较低的速度回放句子开头。因此,用户可以容易地获 取所需信息。这里,单元可以是段落,或可以是句子。

设置单元194可以设置控制部分,使得针对将单词或者短语用作 单元的每一个句子,位于开头的单元的回放速度变为相对较低的速度。 在英语句子中,重要内容经常被包含在句子的开头,例如,谓语布置 在主语之后,并且否定词布置在句子的开头。因此,设置单元194设 置控制部分,使得位于句子开头的单元的回放速度变为相对较低的速 度。此外,语音回放单元140以相对较低的速度来回放句子的开头。 因此,用户可以容易地获取所需信息。

作为另一方法,设置单元194可以设置控制部分,使得针对将句 子用作单元的每个段落,位于段落开头的单元的回放速度变为相对较 低的速度。

针对日语听觉语言数据,设置单元194设置控制部分,使得句子 结尾的回放速度变为相对较低的速度。例如,在控制部分指示执行标 准回放的部分的情况下,设置单元194将位于句子结尾处的单元设置 为控制部分。因而,避免高速回放位于句子结尾处的单元。

在图4A中,附图标记P1指示作为针对日语的设置规则的回放速 度优选为“快”的部分。附图标记P2指示作为针对日语的设置规则的回 放速度优选为“慢”的部分。

在日语句子中,重要内容经常被包含在句子的结尾。因此,例如, 通过设置单元194将控制部分设置为位于句子结尾的单元,语音回放 单元140以相对较低的速度回放句子结尾。因此,用户可以容易地获 取所需信息。这里,单元可以是段落,或可以是句子。

设置单元194可以设置控制部分,使得针对将单词或者短语用作 单元的每一个句子,位于结尾的单元的回放速度变为相对较低的速度。 在日语句子中,重要内容经常被包含在句子的结尾,例如,谓语和否 定词布置在句子的结尾。因此,设置单元194设置控制部分,使得位 于句子结尾的单元的回放速度变为相对较低的速度。此外,语音回放 单元140以相对较低的速度回放句子的结尾。因此,用户可以容易地 获取所需信息。

作为另一方法,设置单元194可以设置控制部分,使得针对将句 子用作单元的每个段落,位于段落结尾的单元的回放速度变为相对较 低的速度。

针对SNS发帖的听觉语言数据,设置单元194设置控制部分,使 得句子结尾的回放速度变为相对较低的速度。

在图4A中,附图标记Q1指示作为针对SNS的设置规则的回放 速度优选为“快”并且音量优选为“低”的部分。附图标记Q2指示作为针 对SNS的设置规则的回放速度优选为“慢”并且音量优选为“高”的部分。

在SNS发帖中,句子开头经常不是非常重要。因此,重要内容经 常被包含在句子结尾处。因此,设置单元194设置控制部分,使得位 于句子结尾处的单元的回放速度变为相对较低的速度。此外,语音回 放单元140以相对较低的速度来回放句子结尾。因此,用户可以容易 地获取所需信息。这里,单元可以是段落,或可以是句子。在简短发 帖的情况下,可以将短语用作单元。

针对报纸和杂志等的文章的听觉语言数据,设置单元194设置控 制部分,使得句子中间附近的回放速度变为相对较低的速度。

附图标记R1和R3指示作为针对文章的设置规则的回放速度优选 为“快”并且音量优选为“低”的部分。附图标记R2指示作为针对文章的 设置规则的回放速度优选为“慢”并且音量优选为“高”的部分。

报纸和杂志文章经常在句子中间附近表达观点。因此,重要内容 经常被包含在句子中间附近处。因此,设置单元194设置控制部分, 使得位于句子中间附近处的单元的回放速度变为相对较低的速度。此 外,语音回放单元140以相对较低的速度回放句子中间区域。因此, 用户可以容易地获取所需信息。这里,单元可以是段落,或可以是句 子。

针对诸如电子邮件之类的消息的听觉语言数据,设置单元194设 置控制部分,使得发件人和正文的回放速度变为相对较低的速度。

在图4B中,附图标记S1和S3指示作为针对电子邮件的设置规 则的回放速度优选为“慢”的部分。附图标记S2指示作为针对电子邮件 的设置规则的回放速度优选为“快”的部分。

设置单元194设置控制部分,使得发件人姓名的回放速度变为相 对较低的速度。此外,语音回放单元140以相对较低的速度回放发件 人姓名。因此,用户可以基于发件人姓名来确定其是否是重要消息。

此外,设置单元194设置控制部分,使得正文的回放速度变为相 对较低的速度。此外,语音回放单元140以相对较低的速度回放正文。 因此,用户可以容易地获取正文中包含的所需信息。

针对网页的听觉语言数据,设置单元194设置控制部分,使得标 题和每个段落的开头的回放速度变为相对较低的速度。这里,能够将 每个段落中的句子用作单元。

在图4C中,附图标记T1和T3指示作为针对网页的设置规则的 回放速度优选为“慢”的部分。附图标记T2和T4指示作为针对网页的 设置规则的回放速度优选为“快”的部分。

设置单元194设置控制部分,使得标题的回放速度变为相对较低 的速度。此外,语音回放单元140以相对较低的速度回放标题。因此, 用户可以基于标题来确定其是否是重要句子。

在网页中,重要内容经常在段落开头提出,接下来一般是附加说 明和具体示例。也就是说,在网页中,重要内容经常被包含在每个段 落的开头。因此,设置单元194设置控制部分,使得位于每个段落开 头的单元的回放速度变为相对较低的速度。此外,语音回放单元140 以相对较低的速度回放每个段落开头。因此,用户可以容易地获取所 需信息。

将要描述分析单元192分析听觉语言数据的语音的强度的情况。 在该情况下,设置单元194可以设置控制部分,使得具有强语音的部 分(也就是以相对较高的音量来回放的部分)的回放速度变为相对较 低的速度。

说话人有时在说话时会增强他的语音,以强调重要部分。因此, 重要内容被包含在具有强语音的部分中的可能性较高。因此设置单元 194设置控制部分,使得具有强语音的部分的回放速度变为相对较低 的速度。此外,语音回放单元140以相对较低的速度来回放具有强语 音的部分。因此,用户可以容易地获取所需信息。这里,能够使用各 种单元。例如,可以将单词、短语或者句子用作单元,或者可以通过 将在每个预定时间处分割听觉语言数据而得到的每个部分用作单元。

将要描述分析单元192分析听觉语言数据的音高是高还是低的情 况。在该情况下,设置单元194可以设置控制部分,使得具有较高音 高的部分的回放速度是相对较低的速度。

由于说话人坚定地说出重要部分,所以重要部分的音高可能上升。 因此,重要内容被包含在具有较高音高的部分中的可能性较高。因此, 设置单元194设置控制部分,使得具有较高音高的部分的回放速度变 为相对较低的速度。此外,语音回放单元140以相对较低的速度来回 放具有较高音高的部分。因此,用户可以容易地获取所需信息。这里, 能够使用各种单元。例如,可以将单词、短语或者句子用作单元。可 以将在每个预定时间处分割听觉语言数据所得到的每个部分用作单元。

以下,将参考图5来描述回放装置100的操作。

图5是示出了当回放装置100执行对向听觉语言数据设置的控制 部分的回放时的处理过程的流程图。例如,在检测到用户操作请求说 话语音的听觉语言数据的回放时,则回放装置100执行图5的处理。

在图5的处理中,首先获取单元120获取听觉语言数据,并将其 输出到控制单元190(步骤S101)。具体来说,通过读出存储设备121 已存储的听觉语言数据,获取单元120获取听觉语言数据。

在控制单元190中,分析单元192分析由获取单元120获取的听 觉语言数据(步骤S102)。

基于分析单元192的分析结果,设置单元194选择控制部分的设 置规则(步骤S103)。设置单元194根据所选择的设置规则,向听觉 语言数据设置控制部分。此外,设置单元194向语音回放单元140输 出其中已设置控制部分的听觉语言数据(步骤S104)。

根据设置单元194已设置的控制部分,语音回放单元140回放来 自设置单元194的听觉语言数据,并输出说话语音(步骤S105)。

此后,图5的处理结束。

按以上方式,分析单元192分析听觉语言数据。基于分析单元192 的分析结果,设置单元194向听觉语言数据设置控制部分。语音回放 单元140根据设置单元194的设置来回放听觉语言数据。

由于设置单元194基于分析单元192的分析结果来设置控制部分, 语音回放单元140可以以较低的速度回放听觉语言数据中包括重要内 容的可能性较高的部分。因此,用户可以容易地获取所需信息。另一 方面,语音回放单元140可以用较高的速度回放除包括重要内容可能 性较高的部分之外的部分。因此,能够缩短整个听觉语言数据的回放 时间。因此,用户可以用更短的时间对未知内容的声音数据中包含的 信息进行拣选。

语音回放单元140以与用户指令相对应的回放速度来回放听觉语 言数据中没有被设置为控制部分的部分。

作为具体示例,将描述对以相对较低的速度回放的部分加以指示 的控制部分的情况。在该情况下,通过使语音回放单元140以相对较 低的速度回放没有被设置为控制部分的部分以及被判断为包括所需信 息的部分,用户可以获取所需信息。另一方面,通过使语音回放单元 140以相对较高的速度回放被判断为不包括所需信息的单元,用户可 以缩短整个听觉语言数据的回放时间。

当检测单元195检测到降低回放速度的用户指令时,语音回放单 元140使回放位置回退,并以降低的回放速度来回放听觉语言数据。

作为具体示例,当检测单元195检测到降低回放速度的用户指令 时,语音回放单元140使回放位置回退到包括当前回放位置在内的单 元的开头。此外,语音回放单元140从单元的开头起以降低的回放速 度来回放听觉语言数据。

因而,由于用户可以从开头收听包括所需信息的单元,所以更容 易地获取所需信息。

作为另一具体示例,当检测单元195检测到降低回放速度的用户 指令时,语音回放单元140使回放位置回退,甚至回溯到在包括当前 回放位置在内的单元的开头之前的位置。此外,语音回放单元140从 回溯位置起以降低的回放速度来回放听觉语言数据。

因而,用户可以掌握包括所需信息在内的单元和前一单元之间的 关系,并更容易地获取所需信息。

语音回放单元140增加控制部分的回放音量。

作为具体示例,将描述对应当以相对较低的速度回放的部分加以 指示的控制部分的情况。在该情况下,当用户通过使回放装置100执 行听觉语言数据的高速回放来搜索包括所需信息的位置时,可以降低 回放所产生的语音刺激用户或周边其他人的耳朵的风险。另一方面, 通过语音回放单元140以相对较高的音量对包括用户所需信息在内的 位置执行回放,用户容易地获取所需信息。

作为另一具体示例,将描述对应当高速回放的部分加以指示的控 制部分的情况。在该情况下,在相对较高速度的回放期间,用户可以 容易地检测包括所需信息的位置。

显示单元130通过文本以可滚动方式来显示听觉语言数据,并且 检测单元195将与显示单元显示的听觉语言数据有关的滚动操作检测 为关于回放速度的用户指令。

因而,用户不需要分别执行在显示单元130的显示上的滚动操作 以及指示回放速度的用户操作。从这一点来说,能够节省用户的时间 和精力。

显示单元130执行显示滚动,以便通过文本来显示听觉语言数据 中由语音回放单元140正在回放的部分。

因而,用户还可以通过视觉来确认语音回放单元140正在回放的 听觉语言数据。例如,即使在因环境噪声等影响而无法听到语音回放 单元140回放的听觉语言数据的情况下,用户仍可以通过在显示单元 130中显示的文本来确认。

此外,用户可以通过语音回放单元140输出的说话语音来确认听 觉语言数据的内容。因此,用户能够获取所需信息,而不用连续地观 看显示单元130。

基于听觉语言数据的类型,设置单元194执行控制部分的设置。

因而,根据听觉语言数据的类型,设置单元194可以设置控制部 分,以便以相对较低的速度来回放包括重要内容的可能性较高的部分。

基于使用听觉语言数据的应用程序,分析单元192确定听觉语言 数据的类型。

因而,通过确定使用听觉语言数据的应用程序的简单处理,分析 单元192可以确定听觉语言数据的类型。

以下参考图6,将描述本发明示例实施例中的听觉语言数据回放 装置100的主要部分。

图6是示出了本发明示例实施例中的回放装置100的主要部分的 示意框图。在图6中,示出了在图1示出的回放装置100的单元之中 的获取单元120、分析单元192、设置单元194以及语音回放单元140。

在图6示出的构成中,获取单元120获取听觉语言数据。分析单 元192分析该听觉语言数据。设置单元194基于分析单元192的分析 结果向听觉语言数据设置控制部分。语音回放单元140根据设置单元 194的设置来回放听觉语言数据。

因而,与图1示出的构成的情况类似,用户可以用更短的时间对 未知内容的声音数据中包含的信息执行拣选。

以下参考图7,将描述回放速度控制部分设置装置(高速回放限 制设置装置)200。

图7是示出了本发明示例实施例中的回放速度控制部分设置装置 (以下有时简称为“设置装置”)200的功能构成的示意框图。在图7 中,示出了在图1示出的回放装置100的单元之中的获取单元120、 分析单元192以及设置单元194。

在图7示出的构成中,获取单元120获取听觉语言数据。分析单 元192分析该听觉语言数据。设置单元194基于分析单元192的分析 结果向听觉语言数据设置控制部分。

让其中设置单元194已设置过控制部分的听觉语言数据被语音回 放装置所回放。因而,与图1示出的构成的情况类似,用户可以用更 短的时间对未知内容的声音数据中包含的信息执行拣选。

设置装置200所包括的功能单元不限于图7示出的功能单元。除 了图7示出的单元之外,设置装置200还可以包括其他功能单元。例 如,设置装置200还可以包括通信单元110(参考图1)。

通过在计算机可读记录介质上记录用于实现回放装置100和设置 装置200的所有或一些功能的程序,并且使计算机读入并执行记录在 该记录介质上的程序,可以执行每个单元的处理。此处,“计算机系统” 包括OS和诸如外围设备之类的硬件。

当使用WWW系统时,“计算机系统”还包括主页呈现环境(或显 示环境)。

“计算机可读记录介质”包括存储设备,例如便携式介质,包括被 并入计算机系统中的软盘、磁光盘、ROM、CD-ROM、以及硬盘等。 此外,“计算机可读记录介质”包括当程序要经由网络(例如互联网或 诸如电话线之类的通信线路)传输时以短暂时长动态保持程序的介质, 如通信线路,以及包括以预定时长保持程序的介质,如该情况下,在 用作服务器或客户端的计算机系统中的易失性存储器。上述程序可以 是用于实现上述功能中一些功能的程序。上述程序可以与已存储在计 算机系统中的程序组合实现。

尽管在上文中参考附图详细描述了本发明的示例实施例,具体配 置不限于这些示例实施例,并且还包括在不脱离本发明保护范围的范 围之内的设计修改等等。

本申请基于并要求于2012年10月31日递交的日本专利申请No. 2012-240430的优先权,通过引用将其公开整体并入本文中。

工业实用性

本发明可应用于回放装置、设置装置、回放方法及程序。

附图标记

100:  听觉语言数据回放装置

110:  通信单元

120:  听觉语言数据获取单元

121:  存储设备

130:  显示单元

140:  语音回放单元

150:  操作输入单元

190:  控制单元

191:  通信控制单元

192:  分析单元

193:  显示控制单元

194:  回放速度控制部分设置单元

195:  用户指令检测单元

196:  应用执行单元

200:  回放速度控制部分设置装置

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号