声明
摘要
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 生物医学领域相关任务
1.2.2 生物医学领域相关资源
1.2.3 生物医学命名实体识别
1.2.4 基因名标准化
1.3 本文主要的研究内容
1.4 本文的组织结构
2 相关模型和算法介绍
2.1 单个分类模型
2.1.1 CRF分类模型
2.1.2 SVM分类模型
2.1.3 ME分类模型
2.2 组合分类器方法
2.3 多代理策略
2.4 Jaro-Winkler Distance算法
2.5 匈牙利算法
2.6 本章小结
3 基于组合分类器和多代理策略的两阶段生物医学命名实体识别方法
3.1 实验语料
3.2 当前存在的一些方法
3.3 识别阶段
3.3.1 标注方法
3.3.2 特征选取
3.3.3 模型构建
3.3.4 两层-叠加方法
3.4 分类阶段
3.4.1 语料存在的数据不平衡
3.4.2 单个代理的构建
3.4.3 代理之间的通信
3.5 本章小结
4 整合多种有效方法的多阶段基因标准化系统
4.1 实验语料
4.2 本文系统
4.2.1 预处理
4.2.2 词典查询
4.2.3 歧义消解
4.2.4 过滤
4.3 本章小结
5 实验结果及分析讨论
5.1 基于组合分类器和多代理策略的两阶段生物医学命名实体识别
5.1.1 命名实体识别阶段的结果
5.1.2 命名实体分类阶段的结果
5.1.3 错误传播的实验结果
5.1.4 结果比较
5.1.5 讨论和错误分析
5.2 整合多种有效方法的多阶段基因标准化系统
5.2.1 实验设置
5.2.2 实验结果比较与分析
5.2.3 错误分析
5.3 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
大连理工大学;