首页> 中国专利> 对包含图像符号的文本消息传达的评价自动打分的服务器

对包含图像符号的文本消息传达的评价自动打分的服务器

摘要

本发明涉及用于计算评分的服务器以及用于计算评分的方法。所述服务器用于计算评分,所述评分为文本文件中的消息所期望传达的、与要评论的对象有关的评价的分数,其中使用文字串和图像符号来编写该消息。在服务器中,利用存储有要评定的指定图像符号与由各图像符号所表达的评价的分数之间的对应关系的图像符号字典存储器,从消息中提取该消息中所使用的、与图像符号字典存储器中所存储的指定图像符号相一致的图像符号,在图像符号字典存储器内检索与所提取出的图像符号相对应的评分,并且基于所提取出的图像符号的综合评分来计算该消息的综合网络评分。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-07-16

    授权

    授权

  • 2011-10-12

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20100204

    实质审查的生效

  • 2010-11-17

    公开

    公开

说明书

技术领域

本发明通常涉及对由文本消息传达的评价(opinion)自动打分的技术。

背景技术

在大多情况下,由经销商和广告公司(例如,专业人士)作出和发布与产品和服务有关的评论和批评。然而,在因特网上,已经将与用户体验和评论有关的大量信息收集至特定网站中。这种不易受任何利益影响的信息,对其它潜在用户或消费者在选择产品和服务时可能是非常重要的指导。

在因特网上,极大关注作为由大量非专业消费者所生成的媒体而起作用的CGM(Consumer-Generated Media,消费者自主媒体)。更具体地,这是具有使用由个人所发布的内容的数据库和媒体的Web2.0站点之一,例如博客(网页博客)、“口碑”网站、“Q&A”社区网站、SNS(Social Networking Service,社交网络服务)或COI(Community-of-Interest,共同权益)网站等。在这些站点之间交换多种信息,所述多种信息不限于与产品和服务有关的信息,而延伸至与日常生活的普通活动有关的内容。

然而,CGM中处理的信息或媒体内容的量极大并且主旨复杂。另外,通常利用使用文字串或字符串编写的文本消息来表达个人意见或评论。

由于这些原因,想参考这些个人意见或评论的第三方需要认真阅读相关文本消息,因为仅瞥一眼这些文本消息不能够较好地理解这些个人意见或评论。另外,第三方不得不观看对于分析来自较大量非专业消费者的看法或评论比较困难的文本消息。

在这些情况下,近年来,如在以下非专利文献中所公开的,已经提供了“评价分析服务”:该“评价分析服务”是允许检索个人已发送或提交至因特网上特定网站的文本文件、并且允许对这些文本文件的内容打分或评定而由此进行评价分析的一类服务:

由Nikkei Research Inc.发布的“NIKKEI RESEARCHblogViz SENSOR,”,URL:http://viz.nikkei-r.co.jp,于2008年12月19日访问;以及

由Dentsu Inc.发布的“DENTSU BUZZ RESARCH,”,URL:http://www.dbuzz.jp,于2008年11月22日访问。

如日本专利3962382所公开的,用于提供前述评价分析服务的传统的评价分析服务器之一首先输入文本文件,并且利用形态分析(morphological analysis)将所输入的文本文件分割成语素。然后,该服务器在对各语素的含义打分后,对由该文本文件所传达的评价打分。这允许用户通过仅瞥一眼该评价的分数,就理解由所输入的文本文件传达的评价。

日本专利3962382与美国专利7,475,007相对应,在此通过引用包含其全部内容。

近年来,随着移动电话环境发展,从移动电话向web服务器发送和提交文本文件日益流行。然而,在大多情况下,与从个人计算机发送文本消息时不同,从移动电话发送来的文本消息不符合普通语言语法(例如,日语语法)。

更具体地,在应用移动电话时,使用“图像符号(pictorialsymbol)”作为特定情感的直接表达来编写文本消息。移动电话的用户使用这种图像符号来补充和强调同一文本消息中特定情感的其它文字表达。

然而,当为包括图像符号的给定文本消息提供已知的评价分析服务时,无法针对该给定文本消息成功进行已知的语言依赖分析,这是因为由于存在图像符号而使得该文本消息不能够被识别为语法正确的消息。在例子中,图像符号位于特定句子的主语应当位于的位置处。

另外,当为利用图像符号来强调或补充同一文本消息中由其它文字串所表达的特定情感的给定文本消息提供已知的评价分析服务时,仅将该图像符号识别为单纯的符号本身。

总的来说,即使将图像符号用作特定情感的直接表达,已知的评价分析服务也不能够基于该图像符号成功地分析由例如移动电话等的数据终端的用户使用该图像符号所编写的文本消息。

考虑到以上,期望提供即使文本消息包括图像符号、也允许成功地分析由该文本消息所传达的评价并对其打分的技术。

发明内容

通常,本发明涉及对由包含图像符号的文本消息所传达的评价自动打分的技术。

根据本发明的一些方面,利用存储有要评定的指定图像符号和由各图像符号所表达的评价的分数之间的对应关系的图像符号字典存储器,从消息中提取该消息中使用的、与图像符号字典存储器中所存储的指定图像符号相一致的图像符号。

此外,在图像符号字典存储器内检索与所提取出的图像符号相对应的评分(opinion score)。

此外,基于所提取出的图像符号的综合评分来计算该消息的综合网络评分,其中,所述综合评分是利用所检索到的评分计算出的。

应注意,除非另外明确规定,否则本说明书中所使用的单数形式包括复数含义。还注意,可以互换使用术语“包含”、“包括”和“具有”。

附图说明

结合附图阅读将更好地理解前述发明内容以及以下对本发明优选实施例的详细说明。为了例示本发明,附图中示出当前优选的实施例。然而,应当理解,本发明不限于所示出的精确配置和功能。

图1是示出使用根据本发明的示例性实施例所构造的评价分析服务器的系统的示意图;

图2是包含在图1所描述的评价分析服务器中的图像符号字典表,用于表示指定图像符号、评分和仅用于修饰性图像符号的强度比之间的对应关系;

图3是包含在图1所描述的评价分析服务器中的文字串字典表,用于表示指定文字串和评分之间的对应关系;

图4是用于示出根据本实施例如何评价第一示例性具体文本消息的第一解释图;

图5是用于示出根据本实施例如何评价第二示例性具体文本消息的第二解释图;

图6是示出图1所描述的评价分析服务器的功能框图;

图7是从概念上示出由图1所描述的评价分析服务器中的计算机要执行的评价分析程序的流程图;

图8示出图4中的(a)所描述的第一消息的中文译文;以及

图9示出图5中的(a)所描述的第二消息的中文译文。

具体实施方式

概述

根据本发明的第一方面,提供一种用于计算评分的服务器,所述评分为文本文件中的消息所期望传达的、与要评论的对象有关的评价的分数,其中所述消息是使用文字串和图像符号编写的,所述服务器包括:

图像符号字典存储器,用于存储要评定的指定图像符号与由各个图像符号表达的评价的分数之间的对应关系;

图像符号提取器,用于从所述消息中提取所述消息中所使用的、与所述图像符号字典存储器中所存储的至少一个指定图像符号相一致的至少一个图像符号;

图像符号评分检索器,用于在所述图像符号字典存储器内检索与所提取出的至少一个图像符号相对应的至少一个评分;以及

评分计算器,用于基于所提取出的至少一个图像符号的综合评分计算所述消息的综合网络评分,其中所述综合评分是使用针对所提取出的至少一个图像符号所检索到的至少一个评分计算出的。

即使文本消息包括图像符号,该服务器也允许成功分析由该文本消息所传达的评价并对其打分。

根据本发明的第二方面,一种用于计算评分的方法,所述评分是文本文件中的消息所期望传达的、与要评论的对象有关的评价的分数,其中,所述消息是使用文字串和图像符号编写的,所述方法包括以下步骤:

提取步骤,用于通过利用存储有要评定的指定图像符号与由各个图像符号表达的评价的分数之间的对应关系的图像符号字典存储器,从所述消息中提取所述消息中使用的、与所述图像符号字典存储器中所存储的至少一个指定图像符号相一致的至少一个图像符号;

在所述图像符号字典存储器内检索与所提取出的至少一个图像符号相对应的至少一个评分;以及

计算步骤,用于基于所提取出的至少一个图像符号的综合评分计算所述消息的综合网络评分,其中,所述综合评分是使用针对所提取出的图像符号所检索到的至少一个评分计算出的。

即使文本消息包括图像符号,该方法也允许成功分析由该文本消息所传达的评价并对其打分。

示例性实施例

根据本发明,提供以下模式作为本发明的示例性实施例。

根据本发明的第一模式,根据本发明的第一方面所提供的服务器还包括用于将所述消息分割成语素的语素分析器,其中,所述图像符号提取器提取分割后的消息的语素中与所述图像符号字典存储器中所存储的指定图像符号至少一个相对应的至少一个语素。

根据本发明的第二模式,根据第一方面或第一模式所提供的服务器还包括:

文字串字典存储器,用于存储要评定的指定文字串和由各文字串所表达的评价的分数之间的对应关系;

文字串提取器,用于从所述消息中提取所述消息中所使用的、与所述文字串字典存储器中所存储的至少一个指定文字串相一致的至少一个文字串;以及

文字串评分检索器,用于在所述文字串字典存储器内检索与所提取出的至少一个文字串相对应的评分;

其中,所述评分计算器基于所提取出的至少一个图像符号的第一综合评分与所提取出的至少一个文字串的第二综合评分的和来计算所述消息的综合网络评分,其中,所述第一综合评分是使用针对图像符号所检索到的至少一个评分计算出的,并且所述第二综合评分是使用针对文字串所检索到的至少一个评分计算出的。

根据本发明的第三模式,在根据第二模式所提供的服务器中,在至少一个选定图像符号被用作用于刻画所述至少一个选定图像符号在语言上所依赖的其它图像符号或文字串的语言修饰成分时,所述图像符号字典存储器存储所述至少一个选定图像符号与至少一个强度比之间的附加对应关系,以及

所述图像符号提取器从所述消息提取所述消息中使用的、与所述图像符号字典存储器中所存储的至少一个选定图像符号相一致的至少一个图像符号,作为修饰性图像符号,

所述服务器还包括:

强度比检索器,用于在所述图像符号字典存储器内检索与所提取出的至少一个修饰性图像符号相对应的至少一个强度比中的至少一个;以及

语言依赖分析器,用于从所述消息中检测所述消息中所使用的、所提取出的一个修饰性图像符号或者所提取出的每个修饰性图像符号在语言上所依赖的至少一个图像符号和文字串,作为依赖图像符号或文字串,

其中,所述评分计算器通过将所检测到的一个依赖图像符号或文字串的评分或者所检测到的每个依赖图像符号或文字串的评分,乘以所提取出的一个修饰性图像符号的强度比或者所提取出的每个修饰性图像符号的强度比,来计算所述消息的综合网络评分,其中,根据所述图像符号字典存储器中所存储的对应关系来定义所述评分和所述强度比。

根据本发明的第四模式,在根据第一方面和第一~第三模式中任一个所提供的服务器中,各评分在与肯定评价和否定评价相对应的离散可能值之间变化。

根据本发明的第五模式,在根据第一方面和第一~第四模式中任一个所提供的服务器中,所述服务器是移动电话中使用的web服务器。

根据本发明的第六模式,根据本发明第二方面所提供的用于计算评分的方法还包括将所述消息分割成语素;其中,所述提取步骤包括以下子步骤:提取分割后的消息中与所述图像符号字典存储器中所存储的至少一个指定图像符号相对应的至少一个语素。

根据本发明的第七模式,根据第二方面或第六模式所提供的用于计算评分的方法还包括以下步骤:

通过利用存储有要评定的指定文字串与由各个文字串表达的评价的分数之间的对应关系的文字串字典存储器,从所述消息中提取所述消息中使用的、与所述文字串字典存储器中所存储的至少一个指定文字串相一致的至少一个文字串;以及

在所述文字串字典存储器内检索与所提取出的至少一个文字串相对应的至少一个评分,

其中,所述计算步骤包括以下子步骤:基于所提取出的至少一个图像符号的第一综合评分与所提取出的至少一个字符串的第二综合评分的和来计算所述消息的综合网络评分,其中,所述第一综合评分是使用针对图像符号所检索到的至少一个评分计算出的,并且所述第二综合评分是使用针对文字串所检索到的至少一个评分计算出的。

根据本发明的第八模式,在根据第七模式所提供的用于计算评分的方法中,在至少一个选定图像符号被用作用于刻画所述至少一个选定图像符号在语言上所依赖的其它图像符号或文字串的语言修饰成分时,所述图像符号字典存储器存储所述至少一个选定图像符号与至少一个强度比之间的附加对应关系,以及

所述提取步骤包括以下子步骤:从所述消息中提取所述消息中所使用的、与所述图像符号字典存储器中所存储的至少一个选定图像符号中的至少一个相一致的至少一个图像符号,作为修饰性图像符号;

所述方法还包括以下步骤:

在所述图像符号字典存储器内检索与所提取出的至少一个修饰性图像符号相对应的至少一个强度比中的至少一个;以及

从所述消息中检测所述消息中所使用的、所提取出的一个修饰性图像符号或者所提取出的每个修饰性图像符号在语言上所依赖的至少一个图像符号和文字串,作为依赖图像符号或文字串,

其中,所述计算步骤包括以下子步骤:通过将所检测到的一个依赖图像符号或文字串的评分或者所检测到的每个依赖图像符号或文字串的评分,乘以所提取出的一个修饰性图像符号的强度比或者所提取出的每个修饰性图像符号的强度比,来计算所述消息的综合网络评分,其中,根据所述图像符号字典存储器中所存储的对应关系来定义所述评分和所述强度比。

根据本发明的其它方面,提供一种其内存储有程序的计算机可读介质,其中,当计算机执行该程序时,实现根据第二方面和第六~第八模式中任一个的方法。

例如,“计算机可读介质”可以采用各种类型中的任一种形式,包括:诸如软盘的磁性记录介质、诸如CD和CD-ROM的光记录介质、诸如MO的光磁记录介质以及诸如ROM的不可移除存储器。

将参考附图更详细地说明本发明的几个现有优选实施例,其中,在所有附图中,相同的附图标记用于表示相同的元件。

现在参考图1,图1示意性示出包括根据本发明的示例性实施例所构造的评价分析服务器1的系统的结构。

如图1所示,多个数据终端(例如,为PC(个人计算机)和移动电话的形式)2可以经由诸如因特网或移动电话网络的网络与评价分析服务器1相连接。

图1示出由“2”表示的PC(个人计算机)形式的第一代表数据终端以及由“2”表示的移动电话形式的第二代表数据终端。例如,可以将PC 2和移动电话2统称为数据终端、终端装置或通信装置等。

例如,评价分析服务器1被配置为存储从移动电话2发送或提交来的文本文件,从而允许从任意第三方访问所存储的文本文件,并分析作为每个文本文件中的消息针对要评论的对象所期望传达的评价(例如,感想、名誉等)的分数的评分。例如,评价分析服务器1可以是移动电话2使用的web服务器(未示出)。

实施例中所处理的“文本文件”不仅包括文本中的文字串(即,文字、字母),而且还包括与普通文本中的字符不同的“图像符号”。

在实施例中,评价分析服务器1支持以日语编写的文本文件中的消息,其中日语不用空格指示单词边界。

也可以被称为“象形图(pictogram)”的“图像符号”是特定含义或内容(例如,情感)的简图表达,并且绝对能够被理解,而无论语言如何。即使所有可能用户的母语与数据终端或移动电话2所使用的语言不同,这些用户也能够理解这种图像符号。

特别地,在移动电话2之间交换的e-mail(即,电子邮件)消息中频繁使用图像符号。例如,为了生成图像符号,提供了诸如“微笑的脸”、“哭泣的脸”和“心形”的各种图片或图像(即,图标)作为各种情感的图形表达。由于这种图像符号充当易于表达特定情感的图标,因此当创建包含文本的电子邮件消息时使用这种图像符号。

为“图像符号”分别指派与普通文本的字符码不同的字符码。一般地,通过用于半角字母数字式字符的ASCII(AmericanStandard Code for Information Interchange,美国信息交换标准码)码、用于诸如日本汉字字符的字符的JIS码或SHIFT-JIS码以及用于多语言字符的Unicode等对文本中的文字字符进行编码。

然而,对于图像符号,移动电话2的运营商唯一定义了它们自己的图像符号和字符码,而不与文本中的文字字符的字符码重叠。由于该原因,如果移动电话2的运营商或制造商不同,则在不同的移动电话2的显示屏上,相同的图像符号不能总是显示为相同的图像。

存在以下情况,即特定运营商在转义码(escape code)之后发送针对移动电话2之间的图像符号的内容的信号。在这种情况下,转义码表示“随后的数据是针对图像符号的数据”。结果,作为诸如个人计算机的数据终端2中的应用程序之一的文本编辑器不能支持任何图像符号。

根据以上将理解,图像符号与文本中的文字字符在诸如编码方式的编写方式方面不同。

图2示出表示如何为指定图像符号指派评分的图像符号字典表。

更具体地,如图2的表所示,对于每个图像符号,存在指定图像符号、类别、标题、评分和强度比之间的对应关系。

通过定义,各个“评分”以最简单的实现方式、直观地对应于肯定评价和否定评价的其中之一。在该实现中,示例性定义每个评分,使得对于肯定评价,评分为“+1”,而对于否定评价,评分为“-1”。

通过定义,当将图像符号中的一个相应图像符号用作用于刻画该相应图像符号在语言上所依赖的、文本文件的同一消息中的其它图像符号的语言修饰成分(例如,副词)时,各“强度比”表示该相应图像信号所展现的强度比或强度系数。

最终,在该实现中,将文本文件的同一消息中所包含的所有图像符号的个体评分合计或综合为总评分或综合网络评分,并且基于该综合网络评分来表达“该消息传达肯定评价或否定评价的强烈程度”。

如图2所示,为标题是“闪烁”且归类为“情感和人体”的图像符号指派评分“肯定P”。为标题是“心”且归类为“情感和人体”的图像符号也指派评分“肯定P”。

相反,为标题是“落泪”且归类为“面部和表情”的图像符号指派评分“否定N”。为标题是“急躁”且归类为“面部和表情”的图像符号也指派评分“否定N”。

此外,如图2所示,为标题是“强调”且归类为“情感和人体”的图像符号指派强度比“1.2”。为标题是“喜悦”且归类为“面部和表情”的图像符号指派强度比“1.1”。

图3示出表示如何为指定文字串指派评分的文字串字典表。

更具体地,如图3的表所示,对于每个文字串,存在指定文字串和评分之间的对应关系。示例性地,为文字串“スペシヤル”(即,中文的“特别的”)和文字串“ウキウキ”(即,中文的“欣喜若狂”)各自指派评分“肯定P”。相反,为文字串“悔しぃ”(即,中文的“失望”)和文字串“バカやろ一”(即,中文的“我真笨”)各自指派评分“否定N”。

图4是用于示出根据实施例如何评价具体示例性消息的第一说明图。

图4中的(a)示出用户针对特定TV节目,不仅使用文字串还使用图像符号实际编写的第一原始消息。在该例子中,TV节目是要评价的对象。对于实际不懂日语的人们,在图8中准备了该第一原始消息的中文译文。

图4中的(b)示出根据实施例利用形态分析如何将图4中的(a)所描述的第一原始消息分割成多个语素。

形态分析是使用计算机进行自然语言处理的技术之一。利用形态分析,将由自然语言的一个或多个字符串构成的给定文本(例如,给定消息)分割成作为各自具有语义的最小语言单元的语素,然后,判断各语素的词性(part-of-speech)。词性判断要求存储有给定语言的语法规则和标记有词性的单词的字典。

在实施例中,将给定消息分割成语素,使得该消息中的每个图像符号与单个语素相对应。

如图4中的(c)所示,根据图2所描述的图像符号字典表和图3所描述的文字串字典表,对这些语素中的选定语素各自打分为肯定的“+1”或否定的“-1”。

更具体地,如下对选定语素打分或评定:

图像符号“闪烁”(第一次出现):+1,

图像符号“闪烁”(第二次出现):+1,

文字串“特别地”:+1,

文字串“欣喜若狂”:+1,

图像符号“心”:+1,

图像符号“落泪”:-1,以及

图像符号“急躁”:-1。

对于图4中的(a)所示的消息,综合网络评分总计为“+3”,这是因为,

+1+1+1+1+1+(-1)+(-1)=3。

图5是用于示出根据实施例如何评价具体示例性消息的第二说明图。

图5中的(a)示出用户针对其它特定TV节目,不仅使用文字串还使用图像符号实际编写的第二原始消息。对于实际不懂日语的人们,图9准备了该第二原始消息的中文译文。

图5中的(b)示出根据实施例利用形态分析如何将图5中的(a)所描述的第二原始消息分割成多个语素。

如图5中的(c)所示,根据图2所描述的图像符号字典表和图3所描述的文字串字典表,对这些语素中的选定语素各自打分为肯定的“+1”或否定的“-1”。

更具体地,如下对选定语素打分:

图像符号“落泪”:-1,

文字串“失望”(第一次出现):-1,

图像符号“强调”(第一次出现):1.2(强度比),

文字串“失望”(第二次出现):-1,

文字串“我真笨”:-1,以及

图像符号“强调”(第二次出现):1.2(强度比)。

在该例子中,第一次出现的图像符号“强调”作为修饰性图像符号依赖于第一次出现的文字串“失望”。第二次出现的图像符号“强调”作为修饰性图像符号依赖于文字串“我真笨”。

因此,图5中的(a)所描述的消息的综合网络评分总计为“-4.4”,这是因为,

(-1)+(-1×1.2)+(-1)+(-1×1.2)=-4.4

在该方面,利用已知的句法分析(Syntactic Analysis)来判断修饰性图像符号依赖于哪个文字串或图像符号。句法分析也被称为“句法剖析(parsing)”或“句法剖析程序”,用于分析文本以判断其语法结构。

一般地,利用句法分析,键入所输入的文本中的树形数据结构以及基于词法分析(Lexical Analysis)的标记,并且针对给定的正式语法构建诸如句法剖析树或抽象句法树的数据结构。这能够确定修饰性图像符号(或文字串)依赖于哪个文字串或图像符号。

在例子中,对于修饰性图像符号,将文本消息中位于紧挨在该修饰性图像符号之前的文字串确定为该修饰性图像符号所依赖的文字串。

图6示出根据实施例的评价分析服务器1的功能框图。

如图6所示,评价分析服务器1被配置为包括:通信接口101,用于允许与数据终端2进行通信;WWW(World Wide Web,万维网)服务器接口102,其充当数据终端2的WWW服务器;以及网络(web)文件存储器103,用于存储已发送或已提交的、且任意第三方可以浏览或访问的文本文件。评价分析服务器1可以是例如移动电话2中所使用的web服务器。

提供预定的评价分析服务的评价分析服务器1进一步被配置为包括以下作为基本功能:形态分析器111;文字串字典存储器112;文字串提取器113;文字串评分检索器114;以及评分计算器115。通过由内置在评价分析服务器1中的计算机(如图6所示,包括处理器和存储器)执行评价分析程序(以下将参考图7的流程图说明),来提供这些基本功能。

形态分析器111从网络文件存储器103输入要分析或评价的文本文件,然后将所输入的文本文件中的消息分割成多个语素。将分割后的消息的这些语素输出至文字串提取器113中。

在文字串字典存储器112中存储有如图3等所示的、要评定的指定文字串与由各文字串所表达的评价的分数之间的对应关系。在例子中,每个评分在与肯定评价和否定评价相对应的、离散的可能值之间变化。

文字串提取器113从输入消息的所有语素中提取与文字串字典存储器112中所存储的指定文字串中的指定字符串相一致的语素。该提取等同于从所存储的所有指定文字串中提取与该消息中使用的相同的文字串。将所提取出的文字串输出至文字串评分检索器114中。

文字串评分检索器114在文字串字典存储器112中所存储的所有评分内检索与所提取出的文字串相对应的评分。将检索到的评分输出至评分计算器115中。

如以下详细所述,评分计算器115基于所有所提取出的文字串的综合评分来计算该消息的综合网络评分。该综合评分是基于针对所有所提取出的文字串所检索到的所有评分计算出的。

评分计算器115将所计算出的综合网络评分与网络文件存储器103内的当前的文本文件相关联。在例子中,在网络文件存储器103内,与当前文本文件的ID编号或名称相关联地存储所计算出的综合网络评分。

根据本发明的评价分析服务器1进一步被配置为还包括:图像符号字典存储器121;图像符号提取器122;图像符号评分检索器123;强度比检索器124;和语言依赖分析器125。通过由内置在评价分析服务器1中的前述计算机执行前述评价分析程序,来提供这些功能。

如上所述的形态分析器111被配置为除将分割后的消息的语素输出至文字串提取器113以外,还将相同的分割后的消息的语素输出至图像符号提取器122。

在图像符号字典存储器121中存储有如图2等所示的、要评定的指定图像符号与由各图像符号所表达的评价的分数之间的对应关系。

图像符号字典存储器121中存储有选定图像符号与强度比之间的附加对应关系。当将选定图像符号分别用作用于刻画该选定图像符号在语言上所依赖的其它图像符号或文字串的语言修饰成分(例如,副词)时,该强度比表示该选定图像符号修饰或强化相同消息的其它部分的强烈程度。

图像符号提取器122从输入消息的所有语素中提取与图像符号字典存储器121中所存储的指定图像符号相一致的语素。该提取等同于从所存储的所有指定图像符号中提取与该消息中所使用的图像符号相同的图像符号。将所提取出的图像符号输出至图像符号评分检索器123中。

图像符号提取器122从输入消息的所有语素中进一步提取与图像符号字典存储器121中所存储的选定图像符号(即,修饰成分)相一致的语素,各自作为修饰性图像符号。将所提取出的修饰性图像符号输出至强度比检索器124中。

图像符号评分检索器123在图像符号字典存储器121内检索所存储的、与所提取出的图像符号相对应的评分。将所检索到的评分输出至评分计算器115中。

强度比检索器124在图像符号字典存储器121内检索所存储的、与所提取出的修饰性图像符号相对应的强度比。将所检索到的强度比输出至语言依赖分析器125中。

语言依赖分析器125从输入消息的所有语素中检测所提取出的修饰性图像符号在语言上所依赖的语素,各自作为依赖图像符号或文字串。通过前述句法分析来进行该操作。

评分计算器115计算所有所提取出的图像符号(包括所检测到的依赖图像符号和所提取出的非修饰性图像符号、但不包括所提取出的修饰性图像符号)的第一综合评分和所有所提取出的文字串(包括所检测到的依赖文字串)的第二综合评分的总和,作为该消息的综合网络评分。

评分计算器115通过对针对所提取出的图像符号所检索到的所有评分求和来计算第一综合评分,使得仅对于依赖图像符号,在将它们乘以所提取出的修饰性图像符号的强度比之后再对它们求和。同样,评分计算器115通过对针对所提取出的文字串所检索到的所有评分求和来计算第二综合评分,使得仅对于依赖文字串,在将它们乘以所提取出的修饰性图像符号的强度比之后再对它们求和。以如使用图4和图5所描述的两个具体例子所示的方式来进行该计算。

如前所述,将所计算出的针对当前文本文件的综合网络评分与网络文件存储器103内的当前文本文件相关联。这些文本文件和综合网络评分可以一起或同时被数据终端2的用户浏览。

对特定对象(例如,TV节目、产品、服务或事件等)感兴趣的数据终端2的用户一旦访问了网络文件存储器103以搜索其它用户对该特定对象的感想或评论的评价分析结果,则仅通过粗略浏览数据终端2的显示屏上表示计分或评定的评价的图或图形,就可以容易地观看这些感想或评论的分数,而无需认真阅读评论该特定对象的其它用户消息。

图7是用于说明根据实施例实现的处理的流程图。

图7示出由内置在评价分析服务器1中的计算机执行前述评价分析程序的步骤。补充说明,图像符号字典存储器121已存储有图2所描述的图像符号字典表,并且文字串字典存储器112已存储有图3所描述的文字串字典表。

(S701)键入使用文字串和图像符号所编写的文本文件。

(S702)将该文本文件中的消息分割成多个语素。

(S703)使用文字串字典表,从该消息中提取分割后的消息中的、与表中所存储的指定文字串相对应的语素。

(S704)使用文字串字典表,检索表中所存储的、与所提取出的文字串相对应的评分。

(S705)使用图像符号字典表,从消息中提取分割后的消息中的、与表中所存储的指定图像符号(包括选定修饰性图像符号)相对应的语素。

(S706)使用图像符号字典表,检索表中所存储的、与所提取出的图像符号相对应的评分。

(S707)使用图像符号字典表,检索表中所存储的、与所提取出的修饰性图像符号相对应的强度比。

(S708)检测所提取出的修饰性图像符号所依赖的所提取出的文字串和图像符号,作为依赖文字串或图像符号。

(S709)在仅将依赖文字串或图像符号的评分乘以针对所提取出的修饰性图像符号所检索到的强度比之后,基于针对所提取出的文字串的第一综合评分与针对所提取出的图像符号的第二综合评分的和来计算综合网络评分。

(S710)与当前文本文件相关联地输出所计算出的综合网络评分。

根据前述说明将理解,即使从例如移动电话2发送来的文本消息使用图像符号,评价分析服务器1、评价分析服务器1的工作方法及用于评价分析服务器1的计算机程序也允许分析该文本消息,以对该文本消息所期望传达的评价进行打分。

尽管以上利用以日语编写的文本消息说明了实施例,然而对于以英语或其它语言(例如,中文、韩语或德语)编写的文本文件的评价分析,本发明也可适用。

然而,为了分析以英语等语言编写的、利用空格指示单词边界而无需进行单词分割的文本文件,可以通过完全或部分省略形态分析的整个处理来实践本发明。

在本发明的示例性变形实现中,可以以例如美国专利7,600,017所公开的方式,使用所输入的文本文件中的消息来归类或识别该消息所涉及的对象,在此通过引用包含该美国专利7,600,017的全部内容。

在该实现中,可以将所识别出的对象和所计算出的综合网络评分(例如,肯定分数或否定分数)与所输入的文本文件相关联地存储。

另外指出,本发明可以如下实施:仅对文本信息中的图像符号进行形态分析,或者对文本信息中的图像符号和文字串均进行形态分析。

在整个说明书中所提及的“一个实施例”或“实施例”表示以与包括在本发明的至少一个实施例中的实施例相结合的方式所描述的特定特征、结构或特点。

因而,整个说明书中多处出现的词组“在一个实施例中”或“在实施例中”未必总是指同一个实施例。此外,在一个或多个实施例中,可以以任何适当的方式组合特定特征、结构或特点。

此外,本发明的方案决不依存于一个公开实施例的所有特征。因而,在详细说明书之后的权利要求书在此特别地地包含在该详细说明书中,其中,每个权利要求独立作为本发明的单独实施例。

本领域的技术人员将理解,可以在不背离本发明的广义发明理念的情况下对实施例进行改变。因此,要理解,本发明不限于所公开的特定实施例,而覆盖了在如由所附权利要求限定的本发明的精神和范围内的所有变形。

相关申请的交叉引用

本申请基于并要求2009年2月4日提交的日本专利申请2009-023311的优先权,在此通过引用包含其全部内容。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号