声明
致谢
摘要
1 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.3 论文的主要内容
1.4 论文的组织结构
2 理论与技术基础
2.1 命名实体的基本概念和翻译特点
2.1.1 人名
2.1.2 地名
2.1.3 组织机构名
2.1.4 人名、地名和组织结构名的相互关系
2.2 现有的双语命名实体识别方法
2.2.1 单语命名实体识别方法
2.2.2 双语命名实体识别方法
2.3 统计机器翻译
2.3.1 基本原理和特点
2.3.2 IBM统计翻译模型
2.3.3 解码算法
2.4 最大熵模型
2.4.1 相关理论介绍
2.4.2 最大熵模型原理
3 平行语料库中命名实体等价对的获取
3.1 问题描述
3.2 系统框架及分析
3.3 命名实体识别
3.3.1 中文命名实体识别
3.3.2 英文命名实体识别
3.4 特征选取
3.4.1 音译模型特征
3.4.2 翻译模型特征
3.4.3 同现频率特征
3.4.4 词长度特征
3.5 基于最大熵的对齐模型
4 实验及分析
4.1 实验设置
4.1.1 实验语料
4.1.2 基线系统
4.1.3 实验环境
4.1.4 评测方法
4.2 实验结果及分析
5 结论与展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集