首页> 中文会议>2009年中国高校通信类院系学术研讨会 >一种基于二叉树的HTML到XML的转换方法研究

一种基于二叉树的HTML到XML的转换方法研究

摘要

随着web技术的发展,如何从web中抽取有用的信息已经成为一个研究的重点,但当前的Web信息大多数都是没有严格的结构性的HTML格式的,很难用一种有效的方法来完成抽取任务.为了进一步解决这一问题,本文在前人研究的基础上提出了一种基于二叉树的HTML到XML的转换方法,把对HTML文件的信息抽取问题转化为对格式良好的XML文件的信息抽取问题.经过实验证明这种方法是有效可行的.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号