声明
摘要
第1章 绪论
1.1 研究背景
1.2 文本级句对齐介绍
1.2.1 对齐的形式化定义
1.2.2 对齐的问题描述
1.2.3 文本对齐策略
1.2.4 文本对齐评价方法
1.3 论文的组织结构
第2章 文本对齐预处理
2.1 双语文本处理
2.1.1 格式处理
2.1.2 段落、句子边界识别
2.2 分词
2.2.1 中文分词
2.2.2 英文词干提取
2.3 命名实体识别
2.3.1 时间、日期、数字识别
2.3.2 人名、地名、组织机构名识别
2.3.3 识别结果
2.4 本章小结
第3章 文本对齐方法
3.1 基于长度的对齐
3.1.1 对齐方法简介
3.1.2 模型表示
3.1.3 长度计算方法
3.1.4 对齐效果
3.2 基于词典的对齐
3.2.1 对齐方法简介
3.2.2 模型表示
3.2.3 词典权重计算方法
3.2.4 对齐效果
3.3 基于长度和词典结合的对齐
3.3.1 对齐方法简介
3.3.2 对齐模型表示
3.3.3 对齐效果
3.4 基于译文的对齐
3.4.1 对齐方法简介
3.4.2 模型表示
3.4.3 对齐效果
3.5 基于锚点的对齐
3.5.1 锚点的定义
3.5.2 常用锚点对齐
3.5.3 本文锚点对齐
3.6 对齐技术比较
3.7 本文对齐方法
3.8 本章小结
第4章 系统实现与实验结果分析
4.1 系统简介
4.1.1 系统结构
4.1.2 系统流程
4.2 对齐算法选取
4.3 文本对齐流程
4.4 实验与结果分析
4.4.1 数据选取与处理
4.2.2 锚点对齐实验分析
4.2.3 段落对齐实验分析
4.2.4 句对齐实验分析
4.5 本章小结
第5章 工作总结与展望
5.1 工作总结
5.2 未来工作展望
参考文献
致谢
硕士期间发表论文及科研项目