首页> 中国专利> 微博内容监测方法及监测系统

微博内容监测方法及监测系统

摘要

本发明公开了一种微博内容监测方法和微博内容监测系统。该方法包括:首先根据关键词对微博网站进行检索;然后,对所采集的微博进行分类处理和评级处理;最后,根据所述微博的级别生成监测信息,并将监测信息发送至接收终端。采用本发明能够快速方便地对微博内容进行监测,有利于相关部门对微博信息进行有效跟踪和及时管理。

著录项

  • 公开/公告号CN102609475A

    专利类型发明专利

  • 公开/公告日2012-07-25

    原文格式PDF

  • 申请/专利权人 浙江省公众信息产业有限公司;

    申请/专利号CN201210016864.3

  • 申请日2012-01-19

  • 分类号G06F17/30(20060101);

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人屠长存

  • 地址 310005 浙江省杭州市莫干山路118号

  • 入库时间 2023-12-18 06:17:12

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-06-15

    授权

    授权

  • 2012-09-26

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20120119

    实质审查的生效

  • 2012-07-25

    公开

    公开

说明书

技术领域

本发明涉及互联网领域,尤其涉及一种微博内容监测方法和微博 内容监测系统。

背景技术

微博以其短小快速的独特魅力迅速吸引了大量用户,引发了微博 议事的浪潮。跟其他信息传播方式相比,微博有其独到之处。首先, 它能更快速地发布和传播信息。由于字数的限制,微博发布的内容短 小精悍,100多字的文本相当于两三条短信,不用像写博客一样花很 多精力去构思,内容迅速生成。第二,微博可以允许任何人或指定人 群阅读、回复、转发,实现了一对多、多对多的N级传播。第三, 微博的传播效果更为显著。短小精悍的信息在到达受众层面时,不会 耗费太多的时间去理解,内容的简易使其更容易被接受。第四,微博 具有实时交互式传播的特性。当前,很多信息都是从微博上第一时间 先被发布的。

由于微博具有裂变性、主动性、即时性等特点,越来越多的网民 乐意通过这种渠道来获取信息、表达观点和传播思想。微博的传播方 式和影响力在急剧增大。基于微博的功能特型,也衍生出了微博用户 特有的行为特征和内容的特型,形成两种形式的传播路径。但是,微 博是一柄双刃剑。它既方便了信息的传播,同时也加大了危机爆发的 频率和破坏力。

本发明的发明人对微博监控相关技术进行了研究,发现现有的 与微博有关的技术都是偏向于发布方式和浏览终端的设备等方面,缺 乏针对内容的主动监管与后续跟踪处理的技术。由于缺少针对微博的 实时监测方法,在出现突发事件或敏感事件的第一时间,有可能产生 误导广大群众的负面言论。而上述与微博有关的技术不能使各政企机 构及时监控微博内容。

发明内容

本发明的发明人发现上述现有技术中对微博缺乏实时监测等问 题,并因此针对该问题提出了一种新的技术方案。

本发明的一个目的是提供一种微博内容监测方法,用于使用户能 够及时准确地监测微博。

根据本发明的第一方面,提供了一种微博内容监测方法。首先, 根据关键词对微博网站进行检索,以采集包含所述关键词的微博。然 后,对所采集的微博进行分类处理和评级处理。其中,分类处理是根 据微博所包含的关键词的类别对所述微博进行分类。评级处理是计算 微博的重要性指数,并根据所述重要性指数和级别阈值得出微博的级 别。最后,根据微博的级别生成监测信息,并将监测信息发送至与微 博的类别相应的接收终端。

优选地,对微博网站进行检索是采用垂直搜索技术或通过微博网 站的API接口进行检索。该检索可以是周期性进行的,并可将所采 集的微博内容存入信息数据库中。

优选地,在对微博网站进行检索之后,还可包括对所采集的微博 进行解析,并将解析结果存入所述信息数据库。该解析结果可包括微 博内容、发布人、转发数、评论数和发布时间。

优选地,该微博内容监测方法还可包括记录所采集的微博中的热 点词汇,以作为下次检索的关键词。

优选地,该评级处理可包括:利用索引从信息数据库中提取所述 解析结果;通过对所述微博内容的解析结果进行计算得到所述微博的 重要性指数;将所述重要性指数与所述级别阈值进行比较,以得出所 述微博的评级处理结果。

优选地,该微博内容监测方法还可包括对所述接收终端的反馈结 果进行统计分析。

本发明还公开了一种微博内容监测系统。该系统可包括检索单 元、分类处理单元、评级处理单元和监测信息单元。其中,检索单元 用于根据关键词对微博网站进行检索,以采集包含所述关键词的微 博。分类处理单元用于根据微博所包含的关键词的类别对所述微博进 行分类。评级处理单元用于计算微博的重要性指数,并根据所述重要 性指数和级别阈值得出所述微博的级别。监测信息单元用于根据微博 的级别生成监测信息,并将所述监测信息发送至与所述微博的类别相 应的接收终端。

优选地,检索单元采用垂直搜索技术或通过微博网站的API接 口进行检索。对微博网站所进行的检索是周期性进行的,并可将所采 集的微博内容存入信息数据库中。

优选地,微博内容监测系统还可包括解析单元。该解析单元可用 于对所采集的微博进行解析,并将解析结果存入所述信息数据库。该 解析结果可包括微博内容、发布人、转发数、评论数和发布时间。

优选地,评级处理单元可利用索引从信息数据库中提取所述解析 结果。然后,对该解析结果进行计算以得出微博的重要性指数,并将 所述重要性指数与所述级别阈值进行比较,从而得出所述微博的评级 处理结果。

优选地,微博内容监测系统还可包括统计分析单元。该统计分析 单元可用于对反馈结果进行统计分析。

优选地,检索单元还可用于记录所采集的微博中的热点词汇,以 作为下次检索的关键词。

本发明的一个优点在于,采用本发明的技术方案,可以方便地从 微博上获取相关信息,并对所获取的微博信息进行分类处理和评级处 理。从而根据微博的级别生成监测信息,并将该监测信息发送至相应 的接收终端。采用本发明能够对微博内容进行实时监测,有利于相关 部门对微博信息进行有效跟踪和及时管理。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明 的其它特征及其优点将会变得清楚。

附图说明

构成说明书的一部分的附图描述了本发明的实施例,并且连同说 明书一起用于解释本发明的原理。

参照附图,根据下面的详细描述,可以更加清楚地理解本发明,

其中:

图1为本发明的一个实施例的微博内容监测方法的流程图;

图2为本发明的另一个实施例的微博内容监测方法的流程图;

图3为本发明的一个实施例的微博内容监测系统的结构示意图;

图4为本发明的另一个实施例的微博内容监测系统的结构示意 图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意 到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相 对布置、数字表达式和数值不限制本发明的范围。

同时,应当明白,为了便于描述,附图中所示出的各个部分的尺 寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决 不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详 细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说 明书的一部分。

在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是 示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具 有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此, 一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行 进一步讨论。

图1示出了根据本发明的一个实施例的微博内容监测方法。

如图1所示,在步骤S101中,根据关键词对微博网站进行检索。

在该步骤中,关键词是预先设定的,并可根据需要进行调整。例 如,可首先设置多个类别,然后在每个类别中设置多个关键词。关键 词可以是该类别的热点词汇、敏感词汇,并可根据需要进行调整。

在该步骤中,可以预先设定微博网站的访问地址和采集规则。可 以利用垂直搜索技术或通过微博网站的API接口进行检索。

上述采集规则的设定可以包括如下内容:

第一、明确采集方式。即明确是采用垂直搜索技术进行采集还是 通过微博网站的API方式进行采集。

第二、明确采集的具体信息。例如,选择微博内容、转发数、评 价数、发布时间等内容的一项或者多项进行采集。

第三、明确采集的周期。例如,每隔10分钟采集一次或者每隔 1个小时采集一次。

在步骤S102中,对所采集的微博进行分类处理和评级处理。

在进行分类处理中,可根据微博所包含的关键词的类别对微博进 行分类,以得出该微博的类别结果。用于分类的关键词可与用于检索 的关键词相同,也可不同。

在对微博进行评级处理时,可以计算该微博的重要性指数,并将 该重要性指数与级别阈值进行比较,以得出该微博的级别结果。可以 根据实际需要设置级别的数目,并调整级别的判断阈值。

在步骤S103中,生成微博的监测信息并进行发送。

在该步骤中,可以根据微博的级别生成监测信息。例如,对于高 级别的微博,可生成红色预警信息。然后,根据微博的类别,将该红 色预警信息发送至与其类别对应的接收终端。例如,若微博属于交通 类别,可将该微博的监测信息发送至交通部门的接收终端和/或相关 人员的手机。

需要说明的是,与微博的类别相对应的接收终端不限于一个。当 与微博类别对应有多个接收终端时,可以将该监测信息发送至多个接 收终端。

采用本发明的技术方案,可以方便地从微博上获取相关信息,并 对所获取的微博信息进行分类处理和评级处理。从而根据微博的级别 生成监测信息,并将该监测信息发送至相应的接收终端。采用本发明 能够对微博内容进行实时监测,有利于相关部门对微博信息进行有效 跟踪和及时管理。

图2示出了根据本发明的另一个实施例的微博内容监测方法。

如图2所示,在步骤S201中,根据关键词对微博网站进行检索, 从而采集包含该关键词的微博。

针对不同的接收终端,对用于检索的关键词可以先分为若干大 类,每一大类中设有多个关键词。例如,针对政府机构的接收终端, 可以分为卫生、环卫、消防、公安、城管、交通等多个类别。其中, 在交通类别中,可设置“脱轨”、“相撞”、“追尾”、“擦撞”、 “动车”、“汽车”等多个关键词。

在本实施例中,除了预先设定检索关键词外,还可通过自动记录 微博的热点词汇,作为之后的检索关键词。

在进行检索时,可采用垂直搜索技术或者通过微博网站提供的 API接口周期性地获取微博内容。可以对特定的微博网站配置网站地 址和采集规则。每个微博网站的信息提取规则可分别进行配置。

上述垂直搜索技术是针对某一行业的专业搜索引擎,是搜索引擎 的细分和延伸,定向分字段抽取出需要的数据进行处理后再以某种形 式记录到信息数据库中。

上述的微博网站的API接口,是根据各微博网站自行发布的接 口,进行更加精确的信息采集,采集到的信息也是分字段记录到信息 数据库中。

在步骤S202中,可以对所检索的微博进行解析,并将解析结果 存入信息数据库中。

所解析的结果可包括发布人、转发数、评论数和发布时间等信息。 需要说明的是,所解析的项目不限于上述内容,可根据需要增加或减 少解析项目。

需要说明的是,既可以选择仅将该微博的解析结果存储到信息数 据库中,也可以选择将所采集的微博内容和解析结果均存入信息数据 库中。

在步骤S203中,对所解析的内容进行分类处理和评级处理。

可以首先利用索引从信息数据库中提取解析结果,之后进行分类 处理和评级处理。

在分类处理中,可根据微博所包含的关键词的类别对微博进行分 类。

例如,当通过关键词“脱轨”检索到名称为《动车温州段脱轨事 件》的微博时,由于“脱轨”一词属于交通类别,因此可将该微博的 类别设定为交通类。这样,在后续步骤中,可将监测信息发送至与交 通类别相应的接收终端。

当微博包含多个关键词,该多个关键词分属于不同的类别时,可 将该微博的类别设定为多个类别,或者设定为包含关键词最多的一个 类别。例如《温州动车脱轨事》微博中包含了“脱轨”、“动车”、 “交通事故”三个关键词,其中“脱轨”、“动车”两个关键词在“交 通”分类下,“安全”关键词在“消防”分类下,因此可将此《温州 动车脱轨事》分类定义为“交通”类,或者将该微博的类别设为“消 防”和“交通”类。

在本发明的技术方案中,可以设置多个级别,例如,可设置“高 级别”、“中级别”和“低级别”三个级别。级别的区分可通过计算 微博的重要性指数,并将重要性指数与级别阈值进行比较得到。

可以计算微博的解析结果以得到重要性指数。例如,可通过如下 公式进行计算:

Vi=(Count1(i)×60%+Count2(i)×40%)

其中,Vi为每条微博的重要性数值,数值越大表示越重要,优先 级越高。Count1(i)为微博信息的转发数,Count2(i)为微博信息的评论 数。

需要说明的是,本发明中的重要性指数不限于通过转发数和评论 数进行计算,也可采用其他的解析结果和计算公式进行计算。

其中,“高级别”可表示微博的受关注程度高,负面意见多,危 害性可能大,需要紧急处理。“中级别”可表示微博受关注程度较高, 有可能爆发负面信息,需要进行引导。“低级别”可表示微博的参与 人员不多,需要进行关注。高中低三个级别的阈值可分别为30000、 15000和5000。

在本实施例中,所检索的名为《动车温州段脱轨事件》的微博的 转发数为56000,评论数为11000,经计算其重要性指数为37000。 因此,该微博属于高级别。

可选地,当用于检索的关键词出现在微博的特定位置,可将该微 博的级别提升。例如,检索词“脱轨”出现在微博的名称或者微博自 身的关键词序列中时,可直接将该微博的级别设为高级别,或者将该 微博的级别提升一级。

在步骤S204中,根据分类结果和评级结果生成监测信息并进行 发送。

可以采用短信形式和/或工单派发形式将监测信息发送至接收终 端。例如,对于高级别的微博,可将包含预警内容的监测信息通过短 信和工单派发两种方式发送至相关部门的接收终端、领导及办事人员 的手机。对于中级别的微博,可通过工单派发方式将监测信息发送至 相关部门的领导的手机,并通过工单派发方式和短信方式发送至该部 门的办事人员的手机。对于低级别的微博,可通过工单派发方式和短 信方式发送至该部门的办事人员的手机,而不派发至该部门领导的手 机。

上述监测信息的发送方式只是示例性的,对监测信息的发送不限 于以上方式,可以根据实际需要采用其他方式进行发送。

在该步骤完成后,还可包括对终端的反馈信息进行统计分析的步 骤。该反馈信息可包括相关部门的工作完成信息和核实信息。

具体地,在收到相关部门的完成信息后,向另一接收终端发送现 场核实指令。例如,通知检索部门对工作任务的办理情况进行现场核 实,并接收现场核实反馈信息。之后,对工作完成信息和核实信息进 行统计分析。

通过该统计分析结果,能够客观真实地反映微博内容监测与预警 团队的运行和问题现状,为领导决策提供有效的辅助工具。

本发明还公开了一种微博内容监测系统。图3示出了根据本发 明的一个实施例的微博内容监测系统。

如图3所示,微博内容监测系统可包括检索单元31、分类处理 单元32、评级处理单元33和监测信息单元34。

其中,检索单元31可根据关键词对微博网站进行检索,从而采 集包含该关键词的微博。检索单元31可以采用垂直搜索技术或通过 微博网站的API接口进行检索。该检索可以是周期性进行,从而能 够及时地获得微博内容。

分类处理单元32和评级处理单元33可以对检索单元31所采集 的微博进行分类和评级处理。其中,分类处理单元32可根据微博中 所包含的关键词的类别对微博进行分类。评级处理单元可以计算所采 集的微博的重要性指数,然后将该重要性指数与预先设定的级别阈值 进行判断,从而得出该微博的级别。在一种实施方式中,该重要性指 数可以根据微博的转发数和评论数进行计算。

监测信息单元34可以根据微博的级别生成监测信息。然后,将 该监测信息发送至与微博的类别结果相对应的接收终端。该接收终端 不限于一个。发送方式可以是工单派发方式和/或短信方式,可根据 需要发送至相关部门的领导的手机和/或办事人员的手机。

图4是根据本发明另一个实施例的的微博内容监测系统。如图4 所示,微博内容监测系统可包括检索单元41、解析单元45、信息数 据库46、分类处理单元42、评级处理单元43、监测信息单元44和 统计分析单元47。

在该系统中,检索单元41、分类处理单元42、评级处理单元43 和监测信息单元44可以与上一实施例中的检索单元31、分类处理单 元32、评级处理单元33和监测信息单元34相同。与上一实施例的 区别在于增设了解析单元45、数据库46和统计分析单元47。

其中,解析单元45可对所采集的微博进行解析,并将解析结果 存入信息数据库46中。信息数据库46不限于存储解析结果,还可存 储检索单元41所采集的微博内容。上述解析结果可包括但不限于发 布人、转发数、评论数和发布时间等内容。可以根据索引从信息数据 库46中提取解析结果,以供分类处理单元42和评级处理单元43进 行处理。当监测信息单元44将监测信息发送至接收终端后,统计分 析单元47可对反馈结果进行统计分析。具体地,在收到相关部门的 完成信息后,可由统计分析单元47接收终端发送现现场核实指令。 例如,通知检索部门对工作任务的办理情况进行现场核实,并接收现 场核实反馈信息。之后,对工作完成信息和核实信息进行统计分析。

采用本发明的微博内容监测方法和监测系统至少具有以下优 点:

第一、与传统的互联网搜索服务相比,在搜索微博内容上速度 更快,目的性更加明确。

第二、由于本发明采用垂直搜索技术,对微博网站的搜索具有 实时性强,搜索全面的特点。

第三、本发明的技术方案与现有技术相比,实用性更强。政企 用户可以通过互联网根据自己的需求轻松的在系统中自由定制多个 监测任务,对所需微博进行跟踪监测。系统能够自动从微博中实时收 集满足用户需求的微博,并推送给用户终端进行处理分析。而当突发 事件或公关危机出现后,系统的实时监测可以使用户第一时间获得微 博。监控部门能够及时做出反应及处理,以便引导舆论走向,避免出 现大量谣言。

虽然已经通过示例对本发明的一些特定实施例进行了详细说明, 但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不 是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离 本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范 围由所附权利要求来限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号