首页> 中文学位 >科技论文DTD的设计及其XML文档生成
【6h】

科技论文DTD的设计及其XML文档生成

代理获取

目录

文摘

英文文摘

第一章引言

第二章XML简介

2.1什么是XML

2.2 XML的优点

2.3 XML的应用

第三章科技论文DTD的设计

3.1设计目标

3.2设计方法

3.3设计步骤

3.3.1文档分分析

3.3.2列出元素

3.3.3确认基本元素

3.3.4确立元素间的关系

3.4 DTD的主要定义

3.4.1元素与属性

3.4.2实体定义

3.4.3符号定义

第四章解析转换器的设计

4.1开发解析转换器的意义

4.2设计目标

4.3功能模块设计

4.4 XML文件设计

第五章解析转换器的实现

5.1开发平台和开发工具

5.1.1开发平台

5.1.2开发工具

5.2 WEB页面抓取

5.3信息抽取

5.3.1元信息抽取

5.3.2文档内容抽取

5.4基于语义的属性添加

5.4.1 汉语分词方案

5.4.2文本层次划分

5.4.3概念词典的建立

5.4.4属性添加

5.5 XML文档解析

第六章结束语

6.1小结

6.2存在的问题

6.3发展与展望

参考文献

文献

URL

致谢

展开▼

摘要

该文首先简要介绍了可扩展标记语言(Extensible Markup Language,简称XML),说明创建科技论文XML文档的意义与使用价值,并提出一个利用科技论文解析转换器将网上科技论文从HTML格式和XML格式转换的方案.然后详细阐述了一套完整的科技论文文档类型定义(Document Type Definition,简称DTD),该DTD给出了科技论文的语义框架.在此基础上进一步介绍科技论文解析转换器的设计与实现过程.该解析转换器以上述DTD为模板,把科技论文格式标注向语义标注的转换.目前,由于中文科技论文的使用在中国占相当比重,该课题主要利用中文信息处理技术,对中文科技论文的语义标注进行了尝试.随着今后该课题的深入展开,将针对其他语种的科技论文信息作进一步探讨.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号