摘 要
Abstract
第1章 绪 论
1.1 本文背景和研究意义
1.2 音乐命吊实体识别中的困难及问题
1.3 国内和国外的研究方法及发展
1.3.1 命吊实体识别NER在国内外的发展
1.3.2 近些年 NER的学习方法
1.4 本文主要内容
第2章 概率统计模型理论
2.1 概率统计模型
2.2 条件随机场模型
2.2.1 简介
2.2.2 条件随机场
2.3 条件随机场模型与其他模型对比
2.3.1 SVM的简要介绍
2.3.2 最大熵的缺点
2.3.3 最大熵马尔可夫模型的介绍
2.3.4 标记偏置问题的简介
2.4 本章小结
第3章 音乐领域的语料标注
3.1 语料获取
3.2 语料净化及分句
3.2.1 网页净化
3.2.2 分句处理
3.3 语料的标记
3.4 语料划分
3.5 词典的建立
3.6 语料预处理
3.7 本章小结
第4章 音乐命吊实体识别
4.1 特征选取
4.1.1 特征模板建立的思想
4.1.2 各种特征介绍
4.1.3 特征文件预处理
4.1.4 对比实验分析
4.2 本系统架构
4.2.1 语料处理模块
4.2.2 训练模块
4.2.3 测试模块
4.2.4 后处理模块
4.3 与其他模型的对比实验
4.3.1 最大熵对比实验
4.3.2 SVM对比实验
结 论
参考文献
附 录
哈尔滨工业大学学位论文原创性声明及使用授权说明
致 谢