法律状态公告日
法律状态信息
法律状态
2016-03-30
未缴年费专利权终止 IPC(主分类):G10L11/00 授权公告日:20120613 终止日期:20150206 申请日:20020206
专利权的终止
2014-06-04
专利权的转移 IPC(主分类):G10L11/00 变更前: 变更后: 登记生效日:20140509 申请日:20020206
专利申请权、专利权的转移
2012-06-13
授权
授权
2006-09-20
发明专利申请公布后的驳回
发明专利申请公布后的驳回
2004-05-05
实质审查的生效
实质审查的生效
2004-02-25
公开
公开
查看全部
技术领域
本发明涉及一种根据声音的特征分析判断情绪的设备,更具体地说,涉及一种根据对吠叫声音的特征分析判断狗的情绪的设备。
背景技术
动物,特别是狗,长期以来与人类有密切的关系,扮演着重要的角色,不仅作为警卫、救助目的的狗,而且作为宠物成为家庭的一员。因此,毫不夸张地说,与狗沟通是人类长期的梦想,并作出了各种努力。发明名称为“了解动物的思想的方法和了解动物的思想的装置”,公开号为JP特开平10-3479的发明专利公开文献,公开了一种了解动物的思想的方法和装置,接收宠物和家畜等动物发出的声音,并且把它转变成声音信号,接收由这些动物的动作形成的摄像,并且把它转变成视频信号,把这些声音信号和视频信号与已经进行过动物行为学的行为分析的声音和动作的数据作比较。依靠这种技术,根据狗的吠声和动作,可以了解狗的思想,但是没有公开具体的相应于狗的情绪的具体声音和动作的数据。
象这样,基于明确地把握狗的具体情绪和具有这种情绪的狗发出的有特色的吠声之间的关系,设定与那种情绪相对应的基准声音模式,根据把狗的吠声与其基准声音模式比较进行的声音的特征分析而客观地判断狗的情绪的装置不存在。因此,具体地说,现在根据吠声客观地判断狗的情绪事实上是不可能的。本发明是为了解决现有技术中的上述诸问题作出的,其目的是提供一种情绪判断设备,通过设定相应于狗的各种情绪的基准声音模式,把它们与狗吠的声音模式相比较,根据狗的吠声客观地判断具体狗的情绪。
发明内容
根据权利要求1所述的本发明,包括变换装置,其把狗的吠声转换成电音频信号;输入声音模式提取装置,其提取所述声音信号的时间和频率成份的关系图的特征作为输入声音模式;情绪区别基准声音模式存储装置,其存储针对每种情绪而表示狗以吠声特征表示各种情绪的声音的时间与频率成份之间的关系图的特征的情绪区别基准声音模式;比较装置,其把所述输入声音模式与所述情绪区别基准声音模式来比较;情绪判断装置,其通过所述比较,判断与所述输入声音模式最相关的情绪;
其特征在于,所述情绪区别基准声音模式,至少包括下列基准声音模式中的一种,
相应于寂寞的情绪的基准声音模式,其具有5000Hz左右重要的频率成份,没有小于3000Hz的频率成份,没有高次谐波成份,并且持续0.2-0.3秒时间;
相应于失落的情绪的基准声音模式,其具有160-240Hz的基音,并且在具有到1500Hz的高次谐波的声音持续0.3-1秒后,没有250-8000Hz的明确的基音和高次谐波,并且具有1000Hz附近重要频率成份的声音持续;
相应于威吓的情绪的基准声音模式,其不具有250-8000Hz的明确基音和高次谐波,和在具有1000Hz左右重要频率成份的声音之后具有240-360Hz的基音,到1500Hz具有明确的高次谐波,和到8000Hz具有高次谐波的声音持续0.8-1.5秒;
相应于自信的情绪的基准声音模式,其不具有250-8000Hz的明确基音和高次谐波,并且具有在1000Hz附近、2000Hz附近和5000Hz附近重要的频率成份;
相应于快乐的情绪的基准声音模式,其不具有250-8000Hz的明确的基音和高次谐波,和在具有1000Hz附近重要的频率成份的声音之后,具有200-300Hz的基音,具有到1500Hz的高次谐波的声音持续;
相应于渴望的情绪的基准声音模式,其具有250-500Hz的基音,和到8000Hz是具有高次谐波的声音,基音的频率变化。
根据权利要求2所述的本发明,包括,把狗的吠声转换成电音频信号的步骤,提取所述音频信号的时间和频率成份的关系图的特征作为输入声音模式的步骤,存储针对每种情绪而表示狗以吠声特征表示各种情绪的声音的时间与频率成份之间的关系图的特征的情绪区别基准声音模式的步骤,把所述输入声音模式与所述情绪区别基准声音模式来比较的步骤,通过所述比较,判断与所述输入声音模式最相关的情绪的步骤;
其特征在于,所述情绪区别基准声音模式,至少包括下列基准声音模式中的一种,
相应于寂寞的情绪的基准声音模式,其具有5000Hz左右重要的频率成份,没有小于3000Hz的频率成份,没有高次谐波成份,并且持续0.2-0.3秒时间;
相应于失落的情绪的基准声音模式,其具有160-240Hz的基音,并且在具有到1500Hz的高次谐波的声音持续0.3-1秒后,没有250-8000Hz的明确的基音和高次谐波,并且具有1000Hz附近重要频率成份的声音持续;
相应于威吓的情绪的基准声音模式,其不具有250-8000Hz的明确基音和高次谐波,和在具有1000Hz左右重要频率成份的声音之后具有240-360Hz的基音,到1500Hz具有明确的高次谐波,和到8000Hz具有高次谐波的声音持续0.8-1.5秒;
相应于自信的情绪的基准声音模式,其不具有250-8000Hz的明确基音和高次谐波,并且具有在1000Hz附近、2000Hz附近和5000Hz附近重要的频率成份;
相应于快乐的情绪的基准声音模式,其不具有250-8000Hz的明确的基音和高次谐波,和在具有1000Hz附近重要的频率成份的声音之后,具有200-300Hz的基音,具有到1500Hz的高次谐波的声音持续;
相应于渴望的情绪的基准声音模式,其具有250-500Hz的基音,和到8000Hz是具有高次谐波的声音,基音的频率变化。
附图说明
图1是表示本发明的一实施方式的系统的构成图。
图2是表示相应于“寂寞”的情绪的典型声音模式的“时间-频率成份关系图”的图(横轴的每个刻度是0.05秒,纵轴的每个刻度是250Hz。特征部分被圈起来)。
图3是表示相应于“失落”的情绪的典型声音模式的“时间-频率成份关系图”的图(横轴的每个刻度是0.025秒,纵轴的每个刻度是250Hz。特征部分被圈起来)。
图4是表示相应于“威吓”的情绪的典型声音模式的“时间-频率成份关系图”的图(横轴的每个刻度是0.05秒,纵轴的每个刻度是250Hz。特征部分被圈起来)。
图5是表示相应于“自信”的情绪的典型声音模式的“时间-频率成份关系图”的图(横轴的每个刻度是0.02秒,纵轴的每个刻度是250Hz。特征部分被圈起来)。
图6是表示相应于“决乐”的情绪的典型声音模式的“时间-频率成份关系图”的图(横轴的每个刻度是0.05秒,纵轴的每个刻度是250Hz。特征部分被圈起来)。
图7是表示相应于“渴望”的情绪的典型声音模式的“时间-频率成份关系图”的图(横轴的每个刻度是0.1秒,纵轴的每个刻度是250Hz。特征部分被圈起来)。
图8是表示情绪区别基准声音模式的实际记录情况例子的图。
具体实施方式
下面参照附图说明本发明的实施形式。图1是表示构成本发明的基于吠声声音的特征分析的狗的情绪判断设备1(下文中简称为情绪判断设备)的方框图。情绪判断设备1由变换装置2、输入声音模式提取装置3、情绪区别基准声音模式存储装置4、比较装置5、情绪判断装置6、和情绪输出装置7构成。
变换装置2是把狗吠声变换成表示它的数字音频信号的构件。虽然没有单独地图示,变换装置2由麦克风、A/D转换器等构成。麦克风接收狗的吠声,把它转换成电信号。A/D转换器把该电信号数字化,产生音频信号。而且,麦克风可以为无线麦克风而独立,能够形成较小的尺寸,以便容易装在吠声分析的狗上。
输入声音模式提取装置3是从音频信号中提取特征模式的构件。虽然没有单独地图示,输入声音模式提取装置3由CPU(也可以为DSP)、存储使得CPU作为输入声音模式提取装置3运行的程序的ROM、用于工作区域的RAM等构成。声音模式一般利用声音信号的时间与频率成份的关系图形式表示。关系图以横轴为时间、纵轴为频率而表示声音之时间的频率分布,其最好利用以一定的时间间隔和一定的频率间隔分割的每个网格内的声音能量分布的形式表示。通过象这样表示关系图,可以包括和定量处理声音信号。具体地说,关系图把频率带分割成多个频段,能把每个频段内的声音能量分布数值化。带宽和频段数量可以确定为合适的值。最好,对声音能量进行合适的数学处理,这样能更明确表示时间的特征等。这种数学处理可以使用各种运算。例如,通过实施适当的窗口函数的选择,适当的无控制作用区的设定,适当的FFT变换单位的设定、适当的释放条件的设定、适当的参考方式的设定、适当的进攻条件的设定、和适当的参考点条件的设定等,可以使关系图更适应目的。在确定后面所述的情绪区别基准声音模式的时候进行与这些数学处理相同的处理。象这样,实施情绪区别基准声音模式的数学处理与实施输入声音模式的数学处理相同,所以如后面所述,通过比较装置5可以简单地实施输入声音模式与情绪区别基准声音模式的比较处理。
情绪区别基准声音模式存储装置4是存储相应于各种情绪的基准声音模式的构件。作为典型方式,情绪区别基准声音模式存储装置4是存储所述情绪区别基准声音模式的ROM。ROM可以是可重写的FLASHROM,相应于将来基准声音模式的更新、情绪数量的增加等,可以重写数据。通常,基准声音模式表现为声音信号的时间与频率成份之间的关系图的形式。关系图以横轴为时间、纵轴为频率表示声音之时变频率分布,最好,利用以一定的时间间隔和一定的频率间隔分割成的每个网格内的声音能量分布的形式表示之。另外,基准声音模式可以是这样的模式,其中关系图的共同的显著部分被特别强调。通过这样,在把输入声音模式与基准声音模式比较的时候,尽管有多种输入声音模式,只要其中具有相应于情绪的一般性显著的部分,就可以与对应于任一种情绪的基准声音模式匹配,可以提高情绪判断的准确度。具体地说,最好,在确定基准声音模式的时候实施的处理,与利用所述输入声音模式提取装置3生成输入声音模式的关系图时实施的数学处理相同。图8是存储在情绪区别基准声音模式存储装置4中的基准声音模式的一例子。频率带被分割成5个频段。在每个频段存储着通过进行向声音能量附加时间因素等的适当的数学处理而得到的值。对于那些值,例如可以象(αx、βx、γx、δx、εx)那样表示第x号的值的组。而且那些值不限于标量,也可以是矢量。另外,由于狗的吠声音调根据狗的品种、狗的大小等变化,在本例子中,通过对每种狗,如A种狗、B种狗、......,确定基准声音模式,可进一步提高情绪判断的精度。对于每个狗种,基准声音模式具有相应于每种情绪(情绪a-f)的数据。另外,对于特定狗种的特定情绪,例如狗种A的情绪a,也具有如a1、a2、......这样的多个典型的数据。通过这样,即使特定狗种的狗具有特定情绪时产生的吠声有多种,仍能正确判断情绪。
在确定相应于狗的各种情绪的基准声音模式的时候,有各种情绪时狗发出的吠声的数据是针对多个狗而采集的。采集吠声时狗的情绪基于动物行为学,通过那时狗的行动、举止而判断。采集的多个吠声数据按情绪区别分类,将与那些情绪区别的吠声数据共同的声音模式定义为相应于那种情绪的基准声音模式。而且,对于这种基准声音模式,象上述那样,特别强调共同的显著部分。作为基本的情绪,采用“寂寞”、“失落”、“威吓”、“自信”、“快乐”、和“渴望”6种情绪。狗的行动和举止与情绪,基于动物行为学象下述这样相对应。“寂寞”的情绪,对应于,静静的,鼻子上抬,发出呜呜声,注视着一点这样的行为。“失落”的情绪,对应于,感到愤怒,发出低沉的声音,不知道干什么这样的行为。“威吓”的情绪,对应于,对于人、物体,既不向前也不离开的夸张地吠叫这样的行为。“自信”的情绪,对应于,连续地高声叫想引起注意这样的行为。“快乐”的情绪,对应于,嬉戏地跳向它们的主人,同时乱蹦乱跳地吠叫这样的行为。“渴望”的情绪,对应于,在进餐和散步期间,向人吠叫显示不能再等、催促这样的行为。下面相应于每种情绪,说明声音模式的特征。
相应于“寂寞”的情绪,对应于这样的声音模式,具有5000Hz左右重要的频率成份,没有小于3000Hz的频率成份,没有高次谐波成份,和持续0.2-0.3秒时间。这种声音模式听起来更像嘶叫声(“ク-ン”、“キュ-ン”)。图2是表示相应于“寂寞”的情绪的典型声音模式的“时间-频率成份关系图”的图。
相应于“失落”的情绪,对应于这样的声音模式,具有160-240Hz的基音,并且在具有到1500Hz的高次谐波的声音持续0.3-1秒后,没有250-8000Hz的明确的基音和高次谐波,并且具有1000Hz附近重要频率成份的声音持续。这种声音模式听起来更像“呜呜呜、哇”声(“グルルルルル、ワン”)。图3是表示相应于“失落”的情绪的典型声音模式的“时间-频率成份关系图”的图。
相应于“威吓”的情绪,对应于这样的声音模式,不具有250-8000Hz的明确基音和高次谐波,和在具有1000Hz左右重要频率成份的声音之后具有240-360Hz的基音,到1500Hz具有明确的高次谐波,和到8000Hz具有高次谐波的声音持续0.8-1.5秒。这种声音模式听起来更像“哇、哽唔哽唔哽唔”声(“ワン、ギャゥ----”)。图4是表示相应于“威吓”的情绪的典型声音模式的“时间-频率成份关系图”的图。
相应于“自信”的情绪,对应于这样的声音模式,不具有250-8000Hz的明确基音和高次谐波,并且具有在1000Hz附近、2000Hz附近和5000Hz附近重要的频率成份。这种声音模式听起来更像“キャン”声。图5是表示相应于“自信”的情绪的典型声音模式的“时间-频率成份关系图”的图。
相应于“快乐”的情绪,对应于这样的声音模式,不具有250-8000Hz的明确的基音和高次谐波,和在具有1000Hz附近重要的频率成份的声音之后,具有200-300Hz的基音,具有到1500Hz的高次谐波的声音持续。这种声音,听起来更像“ヮン、グ---”声。图6是表示相应于“快乐”的情绪的典型声音模式的“时间-频率成份关系图”的图。
相应于“渴望”的情绪,对应于这样的声音模式,其具有250-500Hz的基音,和到8000Hz是具有高次谐波的声音,基音的频率变化。这种声音听起来更像“ギュ---”声。图7是表示相应于“渴望”的情绪的典型声音模式的“时间-频率成份关系图”的图。
比较装置5是把输入声音模式与情绪区别基准声音模式比较的构件。虽然没有单独地图示,比较装置5由CPU(也可以为DSP)、存储使CPU作为比较装置5的程序的ROM、用于工作区域的RAM等构成。比较可以通过加重平衡处理为特征之模式的模式匹配的方法等来进行。比较的结果作为相关的高或低而输出。例如,在使用图8所示形式的基准声音模式的情况下,相对于输入声音模式(αm、βm、γm、δm、εm),比较装置5计算与各个基准声音模式的数据(αx、βx、γx、δx、εx)之间的距离Xm=αm-αx+βm-βx+γm-γx+δm-δx+8m-εx。距离Xm是表示输入声音模式和与之相比较的基准声音模式之间相关程度的指标。与距离Xm为最小的数据(αm0、βm0、γm0、δm0、εm0)相对应的情绪,称为与输入声音模式最相关的情绪。这时的距离Xm=αm-αm0+βm-βm0+γm-γm0+δm-δm0+εm-εm0变为最小距离。在图8的例子中,由于狗种B的基准声音模式a1是(αm0、βm0、γm0、δm0、εm0),在这里距离Xm为最小,情绪a是与输入声音模式相对应的情绪。而且在这种情况下,比较装置5也可以直接地把输入声音模式与基准声音模式的数据进行比较,而不管狗的种类。另外,比较装置5也可以事先输入狗的种类,在该狗的种类范围,通过把输入声音模式与基准声音模式相比较,参考附加的狗之种类,正确判断情绪。
情绪判断装置6是,通过比较装置5对输入声音模式与情绪区别基准声音模式的比较,把与判定最相关的基准声音模式相对应的情绪与该狗的情绪之间进行判断的构件。虽然没有单独地图示,情绪判断装置6由CPU(也可以为DSP)、存储使CPU作为情绪判断装置6运行的程序的ROM、用于工作区域的RAM等构成。
情绪输出装置7是把利用感情判断装置6判断出的情绪向外部输出的构件。情绪输出装置7可以是显示文字、图形等的诸如液晶显示屏和其驱动电路的显示装置,可以是诸如扬声器和声音输出电路这样的音频装置等。另外,情绪输出装置7,也可以以数字数据形式输出判断出的情绪,使得接收这些数据的其它仪器进行特定的动作。例如,也可向狗形机器人的动作控制单元输入那种情绪数据,使狗形机器人作出相应于该情绪的特定的动作。即情绪输出装置7还能够将判断出的情绪作为机器人等的动作而输出。
下面说明情绪判断设备1的动作流程。首先,变换装置2把进行判断情绪的狗的吠声变换成数字电音频信号。然后,输入声音模式提取装置3从变换后的声音信号提取特有的声音模式。声音模式以关系图的形式提取,分配给RAM。然后,比较装置5读取与存储在情绪区别基准声音模式存储装置4中的各种情绪相对应的基准声音模式,把它们与分配给RAM的输入声音模式相比较。比较可以通过加重平衡处理为特征之模式的模式匹配的方法等来进行。通过这种比较,对输入声音模式与各种情绪之间的相关度进行数值化处理。然后,情绪判断装置6将最相关的数值大的情绪判定为那个狗的情绪。最后,情绪输出装置7把判断出的情绪利用文字、声音、数字数据、和动作等形式输出。
权利要求1和2所记载的发明具有这样的效果,把狗的吠声转换成电音频信号,提取所述音频信号的时间和频率成份的关系图的特征作为输入声音模式,存储针对每种情绪而表示狗以吠声特征表示各种情绪的声音的时间与频率成份之间的关系图的特征的情绪区别基准声音模式,把输入声音模式与情绪区别基准声音模式来比较,通过该种比较,判断与所述输入声音模式最相关的情绪,由于该情绪区别基准声音模式与“寂寞”、“失落”、“威吓”、“自信”、“快乐”、和“渴望”情绪相对应,故能基于狗的吠声客观地判断具体的狗的情绪。
机译: 通过吠声的声音分析确定狗的情绪的装置及其方法
机译: 通过吠声的声音分析确定狗的情绪的装置及其方法
机译: 通过声音分析吠声确定狗的情绪的装置及其方法