首页> 中国专利> 用于电子化文章的商品口碑辨识方法及其系统

用于电子化文章的商品口碑辨识方法及其系统

摘要

一种用于电子化文章的商品口碑辨识方法及其系统,其中系将欲辨识商品口碑的文章进行商品品牌、正向口碑与负向口碑的关键字的标注,标注后,使用所标注的关键字,于欲辨识商品口碑的文章中取出口碑叙述句,接着,判断所撷取出的口碑叙述句中是否仅具有一个商品品牌关键字,若是判断具有一个以上的商品品牌关键字或是判断所撷取出的口碑叙述句中的口碑关键字不一致时,则针对口碑叙述句进行样板比对分析,以区隔比对出商品品牌关键字与口碑用词的关联性,并藉此提升判断品牌评价好坏的准确度。

著录项

  • 公开/公告号CN103744893A

    专利类型发明专利

  • 公开/公告日2014-04-23

    原文格式PDF

  • 申请/专利权人 网讯电通股份有限公司;

    申请/专利号CN201310719785.3

  • 发明设计人 李静怡;吴威均;卢佳杰;

    申请日2013-12-23

  • 分类号G06F17/30(20060101);

  • 代理机构11239 北京天平专利商标代理有限公司;

  • 代理人孙刚

  • 地址 中国台湾台北市信义区东兴路45号11楼

  • 入库时间 2024-02-19 23:19:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-03-29

    授权

    授权

  • 2014-05-21

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20131223

    实质审查的生效

  • 2014-04-23

    公开

    公开

说明书

技术领域

本发明关于一种用于电子化文章的商品口碑辨识方法及其系统,特别是指一种能够将网路评价文章进行辨识,以分析比对出商品品牌与评价的关联性。

背景技术

网际网路已经为商品资讯传播的主要管道,消费者在售前会上网询价、比价,而除了价格之外,更大一部份是询问网路上舆论对所欲购买的商品的使用心得与评价,甚至有消费者更会于消费后上网寻求技术上的搜寻,或是负评的回应,因此若是业主能在上述的时间点提供使用者必要的协助或是提出解释,不但可以减少使用者的不满,更能够正面地提高消费者对该项产品的信心,以增加使用该项产品的消费群。

但对于这些网路上的舆论文章如何进行判断品牌与评价好坏,对于业者来说是非常困难的,尤其是当这一类的文章很多时,要进行分析将必须使用大量的人力与时间,如此对于业者来说要进行分析是有难度的,因此如何能够自动分析这一类文章,对于这些业者来说是非常重要的。

因此,若能够将电子化文章进行品牌与正负口碑的关键字的标注后,再将已被标注的关键字所在的口碑叙述句取出,以进行判断商品品牌与评价的关联性,如此应为一最佳解决方案。

发明内容

本发明的目的在于,提供一种用于电子化文章的商品口碑辨识方法及其系统,其能够针对具有商品评价的电子化文章,进行比对与分析出商品品牌与评价的关联性,以增加判断品牌评价好坏的准确度。

为实现上述目的,本发明公开了一种用于电子化文章的商品口碑辨识方法,其特征在于步骤为:

先将欲辨识商品口碑的文章进行商品品牌、正向口碑与负向口碑的关键字的标注;

标注完成后,使用所标注的关键字,于欲辨识商品口碑的文章中取出口碑叙述句;

接着,判断所撷取出的口碑叙述句中是否仅具有一个商品品牌关键字,若是,则进一步判断所撷取出的口碑叙述句中的口碑关键字是否一致,若一致,则将商品品牌关键字与口碑关键字的关联性进行储存;

若是判断所撷取出的口碑叙述句中具有一个以上的商品品牌关键字或是判断所撷取出的口碑叙述句中的口碑关键字不一致时,则针对口碑叙述句进行样板比对分析,以区隔出商品品牌关键字与口碑用词的关联性,并于比对分析完成后,则将商品品牌关键字与口碑关键字的关联性进行储存。

其中:商品品牌、正向口碑与负向口碑的关键字的标注,系依据一通用词汇资料库所内建多笔的商品品牌名称与正负口碑用词,对欲辨识商品口碑的文章进行标注。

其中:样板比对分析系藉由区分商品品牌、正向口碑与负向口碑的关键字后,将商品品牌关键字与前项或后项的正向口碑关键字或负向口碑关键字进行关联性连结,以判断出针对商品品牌关键字的口碑评价。

其中:商品品牌关键字与前项或后项的正向口碑关键字或负向口碑关键字之间的字元系限制于特定字元之间。

还公开了一种用于电子化文章的商品口碑辨识系统,其特征在于包含:

一文章输入模组,用以输入欲辨识商品口碑的文章;

一文章标注模组,与该文章输入模组相连接,用以将欲辨识商品口碑的文章进行商品品牌、正向口碑与负向口碑的关键字的标注;

一叙述句撷取模组,与该文章输入模组及该文章标注模组相连接,使用该文章标注模组所标注的关键字于欲辨识商品口碑的文章中取出口碑叙述句;

一单一品牌判断模组,与该文章标注模组及该叙述句撷取模组相连接,用以判断所撷取出的口碑叙述句中是否仅具有一个商品品牌关键字;

一口碑用词一致性判断模组,与该文章标注模组、该叙述句撷取模组及该单一品牌判断模组相连接,若该单一品牌判断模组判断仅具有一个商品品牌关键字,则进一步藉由该口碑用词一致性判断模组判断所撷取出的口碑叙述句中的口碑关键字是否一致;以及

一样板比对分析模组,与该文章标注模组、该叙述句撷取模组、该单一品牌判断模组及该口碑用词一致性判断模组相连接,用以于该单一品牌判断模组判断具有一个以上的商品品牌关键字或是该口碑用词一致性判断模组判断口碑关键字不一致时,则针对口碑叙述句进行比对分析,以区隔出商品品牌关键字与口碑关键字的关联性。

其中:更包含有一通用词汇资料库,系与该文章标注模组相连接,而该通用词汇资料库内系内建有多笔商品品牌名称与正负口碑用词的资料,而该文章标注模组能够依据该通用词汇资料库内的资料,将欲辨识商品口碑的文章进行标注。

其中:更包含有一商品口碑搜集资料库,系与该口碑用词一致性判断模组及该样板比对分析模组相连接,用以搜集所分析出的商品品牌关键字与口碑用词的关联性。

其中:该口碑用词一致性判断模组若判断所撷取出的口碑叙述句中的口碑关键字一致,则将商品品牌关键字与口碑关键字的关联性储存于该商品口碑搜集资料库中。

其中:该样板比对分析模组若判断所撷取出的口碑叙述句中的口碑关键字一致,则将商品品牌关键字与口碑关键字的关联性储存于该商品口碑搜集资料库中。

由此,本发明可实现如下技术效果:

1.本发明能够将电子化文章进行品牌与正负口碑的关键字的标注后,再将已被标注的关键字所在的口碑叙述句取出,由于口碑叙述句中若发现不只一个商品品牌关键字,或是评价不一致的情况发生,将无法对品牌的评价好坏明确与品牌名称对应,故本发明能够进一步判断商品品牌与评价的关联性,以提升判断品牌评价好坏的准确度。

2.本发明随着通用词汇资料库的扩充,将能够使得判断商品品牌与评价的关联性更加精准,由于本发明采取句型方式比对,因此不需要大量的资料也可以进行学习,预测。

附图说明

图1:本发明用于电子化文章的商品口碑辨识方法及其系统的流程示意图。

图2:本发明用于电子化文章的商品口碑辨识方法及其系统的整体架构示意图。

具体实施方式

有关于本发明的前述及其他技术内容、特点与功效,在以下配合参考图式的较佳实施例的详细说明中,将可清楚的呈现。

请参阅图1,为本发明用于电子化文章的商品口碑辨识方法及其系统的流程示意图,由图中可知,其步骤为:

1.先将欲辨识商品口碑的文章进行商品品牌、正向口碑与负向口碑的关键字的标注101;

2.标注完成后,使用所标注的关键字,于欲辨识商品口碑的文章中取出口碑叙述句102;

3.接着,判断所撷取出的口碑叙述句中是否仅具有一个商品品牌关键字,若是,则进一步判断所撷取出的口碑叙述句中的口碑关键字是否一致,若一致,则将商品品牌关键字与口碑关键字的关联性进行储存103;

4.若是判断所撷取出的口碑叙述句中具有一个以上的商品品牌关键字或是判断所撷取出的口碑叙述句中的口碑关键字不一致时,则针对口碑叙述句进行样板比对分析,以区隔出商品品牌关键字与口碑用词的关联性,并于比对分析完成后,则将商品品牌关键字与口碑关键字的关联性进行储存104。

请参阅图2可知,该用于电子化文章的商品口碑辨识系统1,系包含一文章输入模组11、一文章标注模组12、一叙述句撷取模组13、一单一品牌判断模组14、一口碑用词一致性判断模组15、一样板比对分析模组16、一通用词汇资料库17及一商品口碑搜集资料库18,其中该文章输入模组11,系用以输入欲辨识商品口碑的文章,而输入的欲辨识商品口碑的文章则能够藉由与该文章输入模组11相连接的文章标注模组12,将欲辨识商品口碑的文章进行商品品牌、正向口碑与负向口碑的关键字的标注;

由于该通用词汇资料库17内系内建有多笔商品品牌名称与正负口碑用词的资料,因此当要进行标注时,该文章标注模组12能够依据该通用词汇资料库17内的资料,于欲辨识商品口碑的文章中进行辨识是否有于该通用词汇资料库17中所建立的商品品牌名称与正负口碑用词,若有则进行标注,以有下列内容举例说明,「我们家本来喝S26,我也觉得会虚胖,现在改喝优生」,其中能够将虚胖标注为负向口碑用词,而改喝则标注为正向口碑用词。

之后,再藉由与该文章输入模组11及该文章标注模组12相连接的叙述句撷取模组13,藉由该文章标注模组12所标注的关键字于数笔含有口碑的文章中取出数笔口碑叙述句,而该叙述句撷取模组13能够取得商品及口碑所在的位置,其中会含概完整的句子,例如下列的含有口碑的文章中:

<div class="body dfs"><p>可以去参加妈妈教室呀</p>

<p>孕妇也需要一些活动量~</p>

<p>参加妈妈教室一则学习当妈妈</p>

<p>一则认识其他的妈咪可以当同学~</p>

<p>有的课程可以拿到小赠品我觉得也是不错的附加价值~</p>

<p>妈咪教室的课程也满多的</p>

<p>像是再生缘、优生、mamaway参加过经验都还不错唷</p>

<p>学到的知识是真的很受用~</p>

其中「优生」与「不错」皆为正负口碑用词,因此藉由「优生」与「不错」于此篇文章中筛选出叙述句「像是再生缘、优生、mamaway参加过经验都还不错唷」,而叙述句撷取更具有长句断句规则与短句断句规则,其中会先检查句子长度,以判断要进行长句断句(本实施例中则是设定每一句长度大于超过25个字元,则进行长句断句)或短句断句(设定每一句长度小于超过25个字元,则进行短句断句),而长句断句规则则是以标点符号断句,截取正负口碑用词涵盖范围,反之,短句断句规则则是以短句的前后句子扩展,以截取正负口碑用词的涵盖范围。

取出口碑叙述句后,先由与该文章标注模组12及该叙述句撷取模组13相连接的单一品牌判断模组14进行判断所撷取出的口碑叙述句中是否仅具有一个商品品牌关键字,之后,再藉由与该文章标注模组12、该叙述句撷取模组13及该单一品牌判断模组14相连接的口碑用词一致性判断模组15进行判断所撷取出的口碑叙述句中的口碑关键字是否一致,例如,对于这一个商品品牌的评价是否皆为正向或负向,若是评价一致,则将商品品牌关键字与口碑关键字的关联性储存于该商品口碑搜集资料库18中,以使后续能够搜集已分析出的商品品牌关键字与口碑用词的关联性。

但除了上述的情况之外,由于本发明的实施例是取各品牌从2012年6月到11月的文章约13000篇,其中非单一品牌或口碑用词不一致的共1068篇,其中具有口碑的文章78篇,不具有口碑的990篇,但其中具有口碑的文章78篇中由于有不只一个商品品牌关键字,或是评价不一致的情况发生,因此很难准确判断具有口碑的文章78篇中对品牌的评价好坏,故会造成1068篇文章判断品牌的评价好坏的准确率为0%;

而上述所提不只一个商品品牌关键字,或是评价不一致的情况,由78篇文章中其中一篇明显得知,其中口碑叙述句为:「亚培,不贵阿~最贵的是塔洛卡妮和,雀巢,和新安吧~我目前是用新安安哺~贵~想等现货用完,要换,ㄋㄋ了~」,由于口碑叙述句中就有「亚培」、「塔洛卡妮」、「雀巢」、「新安」、「要换」五组关键字,因此将无法准确对品牌的评价好坏与品牌名称进行对应,故会发生样板比对不到或是比对错误的情况发生;

为了克服以上问题,必须藉由与该文章标注模组12、该叙述句撷取模组13、该单一品牌判断模组14及该口碑用词一致性判断模组15相连接的样板比对分析模组16进行样板比对分析,以区隔出商品品牌关键字与口碑关键字的关联性,样板比对分析示范如下:

其口碑叙述句为:我们家本来喝S26,我也觉得会虚胖,现在改喝优生

其中商品品牌关键字为「S26」跟「优生」;

其中口碑关键字为「虚胖」跟「改喝」;

藉由上述内容将口碑叙述句分析为”{原本,本来}+{喝,用}+Brand+[Brand]+(Brand)+Brand”,其中「{}」代表列举字词的集合、Element代表可替换字词、「+」代表前后项分隔0~25个字元、「(Brand)」代表该Brand为正向口碑、「[Brand]」代表该Brand为负向口碑;

而Brand为「S26」跟「优生」、[Brand]为虚胖、(Brand)为改喝,因此将接近的品牌与口碑进行配对,故将「S26」跟「虚胖」一起归类为负向口碑,而「改喝」跟「优生」则归类为正向口碑,如此将能够判断口碑叙述句「我们家本来喝S26,我也觉得会虚胖,现在改喝优生」中对于S26这个品牌评价为负向口碑,对于优生这个品牌评价为正向口碑。

针对以上具有口碑的文章78篇文章,使用26个样板进行样板比对分析,则能够于78篇中可标出60篇文章具有口碑,而准确率能够由0%提高到76.92%,因此可知,本发明的技术将能够降低因样板比对不到或是比对错误的情况所造成的准确率偏低的情况发生,以提升判断品牌评价好坏的准确度。

而当该样板比对分析模组16辨识完成后,则能够将商品品牌关键字与口碑用词的关联性储存于该商品口碑搜集资料库18中,以使后续能够搜集已分析出的商品品牌关键字与口碑用词的关联性。

本发明所提供的用于电子化文章的商品口碑辨识方法及其系统,与其他习用技术相互比较时,其优点如下:

1.本发明能够将电子化文章进行品牌与正负口碑的关键字的标注后,再将已被标注的关键字所在的口碑叙述句取出,由于口碑叙述句中若发现不只一个商品品牌关键字,或是评价不一致的情况发生,将无法对品牌的评价好坏明确与品牌名称对应,故本发明能够进一步判断商品品牌与评价的关联性,以提升判断品牌评价好坏的准确度。

2.本发明随着通用词汇资料库的扩充,将能够使得判断商品品牌与评价的关联性更加精准,由于本发明采取句型方式比对,因此不需要大量的资料也可以进行学习,预测。

藉由以上较佳具体实施例的详述,系希望能更加清楚描述本发明的特征与精神,而并非以上述所揭露的较佳具体实施例来对本发明的范畴加以限制。相反地,其目的是希望能涵盖各种改变及具相等性的安排于本发明所欲申请的专利范围的范畴内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号