声明
致谢
摘要
1.绪论
1.1.研究背景及意义
1.2.研究发展及现状
1.3.论文的主要内容
1.4.论文的组织结构
2.理论与技术基础
2.1.命名实体识别
2.2.命名实体翻译等价对的获取
2.3.统计机器翻译
2.4.归纳学习法
2.5.日语假名
2.6.罗马字
3.日语假名和汉语实体对的自动获取
3.1.从单语语料库中抽取命名实体
3.1.1 最大熵模型
3.1.2 条件随机场模型
3.1.3 汉语命名实体抽取
3.1.4 日语命名实体抽取
3.2.假名命名实体的标注方法
3.3.实例筛选
3.3.1 频数统计
3.3.2 编辑距离
3.3.3 余弦距离
3.4.归纳学习
3.5.规则校正
3.6.实体中汉字的处理
3.7.假名实体对的获取
4.实验及分析
4.1.基线系统
4.2.实验设置
4.2.1 实验语料
4.2.2 实验工具
4.2.3 参数设定
4.2.4 评价方法
4.3.实验结果
5.结论
参考文献
附录
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集