文摘
英文文摘
昆明理工大学学位论文原创性声明及关于论文使用授权的说明
第一章绪言
1.1基于本体的Web非规范知识采集研究的产生背景:
1.2基于本体的Web非规范知识采集研究的发展
1.2.1基于本体的Web非规范知识采集的相关方法
1.2.2基于本体的Web非规范知识采集中规则的表示
1.2.3基于本体的web非规范知识采集具有的特点
1.3本课题主要解决的问题
1.4本课题的主要研究内容
1.5论文的结构
第二章相关标准
2.1HTML(Hyper Text Markup Language)
2.2XML
2.2.1XML的产生
2.2.2XML语法
2.2.3元素(EIement)与标记(Tag)
2.2.4属性(Attribute)
2.2.5XML验证(Validation)
2.2.6样式单
2.2.7XML包括一套相关的标准:
2.3XHTML
2.4DOM(Document Object ModeI)
2.5XPath
2.5.1查询
2.5.2定位路径(Location Path)
2.5.3表达式
2.6XSLT
2.6.1模板
2.6.2取得节点值
2.6.3应用模板
2.6.4默认模板规则
2.6.5循环
2.6.6选择
2.6.7变量
2.6.8按名称调用模板
2.6.9用Java扩展XSLT
2.6.10EXSLT(Extensions to XSLT)
第三章相关技术综述
3.1 Bot技术
3.1.1网络机器人的结构分析
3.1.2 Spider程序结构
3.1.3如何构造Spider程序
3.1.4小节
3.2Lucene技术
3.2.1 Lucene的原理分析
3.2.2小节
3.3本体
3.3.1本体的概念
3.3.2本体的建立过程
3.3.3 Ontology的知识表示
3.3.4 Ontology的构建规范
3.3.5本体建设工具
2.3.6本课题使用的技术
3.4DOM模板
3.4.1 DOM的定义
3.4.2DOM模板的简介和发展
3.4.3 DOM的主要特点
3.4.5 DOM和HTML树型逻辑结构
3.4.6两个常用的编程接口:Node和HTML Collection
3.5HTML转换XML的技术
3.5.1问题的提出
3.5.2实现HTML到XML转换的必要性
3.5.3HTML-XML转换相关的技术
3.5.4本课题使用的技术
3.6XML的存储技术
3.6.1 XML数据存储技术研究现状
3.6.2本课题采用的技术
第四章基于领域本体的资源管理平台
4.1总体框架:
4.2各部分的功能:
4.3平台管理的资源
4.4基于本体的领域资源管理系统框架的设计原则
4.5本体开发语言RDF/RDFS
4.6资源存储
第五章基于本体的Web非规范知识采集系统:
5.1Web页面信息抽取系统的一般实现
5.1.1 Web信息抽取系统的工作过程
5.1.2Web信息抽取系统工作原理示意图
5.2基于本体的Web非规范知识采集系统
5.2.1 HTML-XML转换包装器的系统设计思想
5.2.2 HTML-XML包装器的软件结构
5.2.3HTML-XML包装器的实现流程
第六章总结与展望
致谢
参考文献
附录:攻读学位期间发表论文情况