首页> 中文会议>第二届全国信息检索与内容安全学术会议 >基于树模型算法的动态网页信息抽取研究

基于树模型算法的动态网页信息抽取研究

摘要

动态网页是Internet上重要的网页类型,它们通常是由网站的后台数据库通过某种通用的模板构成.如何从动态网页中抽取信息有着十分重要的意义,因为它们通常是一个网站最为主要的信息来源.本文提出了一种新的基于树模型算法的动态网页信息抽取方法.它通过树编辑距离模型和树归并算法(TreeAlign)分离并抽取出动态网页中的信息项.实验表明,这种基于树模型的抽取方法能够准确的定位和抽取动态网页信息.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号