首页> 中文学位 >基于切片方法的XML信息抽取应用研究
【6h】

基于切片方法的XML信息抽取应用研究

代理获取

目录

文摘

英文文摘

东南大学学位论文独创性声明及使用授权的说明

第一章引言

1.1 XML背景及应用

1.1.1 XML信息传输模型

1.1.2数据的交换

1.1.3数据表示

1.2程序切片的研究和发展

1.3问题提出

第二章XML基本概念

2.1 XML标记语法

2.2 XML文档结构

2.3 XML文档的访问方法

2.4 XML验证

2.5 XML与知识对象

第三章基于SBT的文档信息抽取方法

3.1 SBT基本概念

3.2 SBT方法实现

3.3 SBT切片算法

第四章基于切片方法的XML信息抽取

4.1 XML文档形式化表示方法

4.1.1结构化文档特征抽象

4.1.2 XML文档的逻辑公式表示

4.2 XML切片

4.2.1语义依赖

4.2.2语义依赖图

4.3 XML切片算法

4.3.1问题讨论

4.3.2 XML切片的算法

4.3.3算法的进一步讨论

4.4基于切片方法XML信息抽取几点问题

结束语

致谢

参考文献

展开▼

摘要

随着Internet/Intranet发展,Web应用领域扩大,XML已成为面向Web的网络语言.基于XML信息抽取成为与Web语义相关的重要研究课题.该文在分析XML语义及基于SBT信息抽取方法基础上,利用程序切片思想,根据XML语义特点,逐步深入地建立了将XML文档结构转化为逻辑公式集的模型,用以描述XML标记及标记数据间的语义依赖关系.同时提出XML文档切片理论和方法.这一理论方法可应用于Web信息抽取与数据挖掘等方面.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号