文摘
英文文摘
声明
1绪论
1.1研究背景
1.2研究意义
1.3研究现状
1.4本文的工作
2可比语料库命名实体翻译等价对抽取
2.1问题描述
2.2命名实体翻译等价对抽取系统
2.3难点分析
2.4相关模型
2.4.1统计机器翻译模型
2.4.2判别学习算法
2.4.3支持向量机模型
3基于多特征的命名实体等价对抽取
3.1命名实体抽取
3.1.1中文命名实体抽取
3.1.2英文命名实体抽取
3.2特征选取
3.2.1音译模型特征
3.2.2翻译模型特征
3.2.3拼音串匹配特征
3.2.4词长度特征
3.2.5词的同现频率特征
3.2.6匹配模型特征
3.3命名实体翻译等价对计算模型
4多特征的融合
4.1命名实体翻译等价对中判别学习定义
4.2基于MSR算法的多特征融合方法
4.2.1特征权重区间确定
4.2.2特征的选择
4.2.3基于MSR算法的权重计算方法
5命名实体翻译等价对的对齐
5.1阈值限定
5.2基于SVM对齐模型
5.2.1特征的选择
5.2.2模型的训练
5.2.3模型的测试
6实验与评估
6.1语料及评价方法
6.2实验
6.2.1各个特征作用
6.2.2多特征融合结果
6.2.3对齐模型结果
6.3实验总结
结 论
参考文献
攻读硕士学位期间发表学术论文情况
致 谢