中文封面
英文封面
摘 要
Abstract
目 录
第1章 绪论
1.1 课题背景
1.2 本课题研究意义
1.3 国内外相关技术发展现状
1.4 本文主要研究内容
1.5 本章小结
第2章 新词发现方法概述
2.1 基于语言学的新词发现
2.2 基于统计的新词发现
2.3 两种方法的混合
2.4 本章小结
第3章 条件随机场模型描述
3.1简介
3.2 标记偏见问题
3.3 条件随机场模型
3.3.1 条件随机场定义
3.3.2 条件随机场的参数估计
3.4 条件随机场与以往模型的比较
3.4.1隐马尔可夫模型的缺点
3.4.2最大熵马尔可夫模型的缺点
3.4.3条件随机场的优点及不足
3.5 本章小结
第4章 基于条件随机场的新词发现系统
4.1 训练集和测试集的准备
4.2 基于条件随机场的新词发现方法
4.3 网页净化技术
4.3.1 HTML Parser
4.3.2 页面净化模块
4.4 新词筛选和反馈系统
4.5 本章小结
第5章 实验结果及分析
5.1 实验环境
5.2 测试结果与分析
5.2.1 测试结果及分析
5.2.2 错误结果分析
5.3 反馈规则效率讨论
5.4 本章小结
结 论
参考文献
攻读学位期间发表的学术论文
哈尔滨工业大学硕士学位论文原创性声明
哈尔滨工业大学硕士学位论文使用授权书
致 谢
简 历