首页> 中国专利> 获取网页中影视主体的方法及装置

获取网页中影视主体的方法及装置

摘要

本发明涉及网络数据通信领域,其公开了一种获取网页中影视主体的方法及装置。该方法包括:在待挖掘影视主体的网页中抽取待挖掘文本,并根据预设切分规则对待挖掘文本进行切分,得到句子集合;在句子集合中,提取所有句子的最长公共子句作为候选影视主体;根据候选影视主体确定该网页的影视主体。通过本发明,能够避免现有技术中当存在大量需要解析的网站时,编写包装器的繁琐过程,还克服当网页结构经常发生变化时,由于无法实时地检测出网页结构的变化,而造成解析失败的缺陷。

著录项

  • 公开/公告号CN103455572B

    专利类型发明专利

  • 公开/公告日2016-10-05

    原文格式PDF

  • 申请/专利号CN201310364935.3

  • 发明设计人 孙林;陈培军;秦吉胜;

    申请日2013-08-20

  • 分类号

  • 代理机构北京智汇东方知识产权代理事务所(普通合伙);

  • 代理人康正德

  • 地址 100088 北京市西城区新街口外大街28号D座112室(德胜园区)

  • 入库时间 2022-08-23 09:47:48

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-10-05

    授权

    授权

  • 2014-01-15

    实质审查的生效 IPC(主分类):G06F 17/30 申请日:20130820

    实质审查的生效

  • 2013-12-18

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号