文摘
英文文摘
声明
第一章绪论
1.1引言
1.2国内外研究现状及发展动态
1.3论文研究目的与意义
1.4论文主要研究内容及其组织
1.4.1论文研究的主要内容
1.4.2论文组织
第二章PDF文档结构研究
2.1 PDF文档概述
2.1.1 PDF文档线状综述
2.1.2 PDF规范的发展
2.1.3 PDF文档的优点
2.1.4 PDF格式与HTML及XML格式比较
2.2 PDF文档语法
2.2.1 PDF对象
2.2.2 PDF文件结构
2.2.3 PDF文档逻辑结构
2.2.4 PDF线性结构
第三章英文发音系统研究
3.1概述
3.2 PDF文本信息提取的实现
3.2.1主3叉引用表与第一页交叉引用表的提取与合并
3.2.2寻找、提取存放正文中各页内容的stream流。并进行解码
3.2.3提取正文文本及其相关信息
3.2.4文本及其相关信息提取的实现
3.3英文发音系统
第四章系统实现
4.1系统实现原理
4.2 PDF文档分析
4.2.1 PDF基本语法
4.2.2修改过的PDF文件结构
4.2.3 Hello World文件分析
4.3实现方法
4.3.1交叉引用表的提取与合并
4.3.2提取Stream流
4.3.3解码Stream流
第五章总结与展望
5.1工作总结
5.2工作展望
致谢
参考文献
作者简历 攻读硕士学位期间完成的主要工作