首页> 中文学位 >面向医疗知识的PDF文本内容提取系统设计与实现
【6h】

面向医疗知识的PDF文本内容提取系统设计与实现

代理获取

目录

第一个书签之前

摘 要

Abstract

第1章 绪 论

1.1 课题来源及研究意义

1.2 与本课题相关的国内外研究综述

1.2.1 PDF文档国内外研究综述

1.2.2 医疗知识挖掘国内外研究综述

1.3 本论文的主要工作内容

1.4 本论文的组织结构

第2章 PDF文本内容提取系统基础理论和相关技术

2.1 PDF文档介绍

2.1.1 PDF概述

2.1.2 PDF文档格式

2.1.3 PDF文档示例

2.2 XML介绍

2.2.1 XML概述

2.2.2 XML文档示例

2.3 本章小结

第3章 PDF文本内容提取系统需求分析与概要设计

3.1 PDF文本内容提取系统需求分析

3.1.1 总体需求分析

3.1.2 TXT转换模块功能需求分析

3.1.3 XML转换模块功能需求分析

3.1.4 系统非功能性需求分析

3.2 PDF文本内容提取系统总体设计

3.2.1 系统功能模块设计

3.2.2 系统体系架构设计

3.3 本章小结

第4章 PDF文本内容提取系统的详细设计及实现

4.1 系统开发环境和开发工具

4.2 TXT转换模块详细设计与实现

4.2.1 TXT转换模块总体方案设计与实现

4.2.2 文件夹遍历操作

4.2.3 定位到关键位置

4.2.4 数据流解码

4.2.5 Stream流解码后的字符串

4.2.6 PDF文本内容提取

4.3 XML转换模块详细设计与实现

4.3.1 XML转换模块框架设计

4.3.2 语义模型设计

4.3.3 XML格式转换流程设计与实现

4.4 本章小结

第5章 PDF文本内容提取系统测试

5.1 测试方案

5.2 系统功能测试

5.2.1 TXT转换模块测试

5.2.2 XML转换模块测试

5.3 系统性能测试

5.4 测试结论

5.5 本章小结

结 论

参考文献

哈尔滨工业大学学位论文原创性声明和使用权限

致 谢

个人简历

展开▼

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号