声明
摘要
第1章绪论
1.1课题提出
1.1.1食品安全监管中信息不对称
1.1.2食品安全突发事件相关数据库
1.2中文分词及其研究现状
1.3本文研究内容
1.4研究意义
1.4.1对食品安全突发事件数据库构建的意义
1.4.2对食品安全领域自然语言处理任务的意义
1.5研究方法和技术路线
1.5.1研究方法
1.5.2研究技术路线
1.6本文组织结构
第2章中文分词的主要方法
2.1中文分词的技术难点
2.2中文分词中准确率和召回率介绍
2.3中文分词主要方法
2.4隐马尔可夫模型
2.4.1隐马尔可夫模型介绍
2.4.2隐马尔可夫模型在序列标注中的应用
2.5最大熵马尔可夫模型
2.5.1最大熵马尔可夫模型介绍
2.5.2最大熵马尔可夫模型在序列标注中的应用
2.5.3标注偏置问题
2.6条件随机场模型
2.6.1条件随机场模型介绍
2.6.2条件随机场模型在序列标注中的应用
2.7深度学习介绍
2.7.1人工神经网络
2.7.2深度学习的发展
2.7.3深层神经网络的模型结构
2.7.4深度学习的在序列标注上的应用
第3章面向食品安全突发事件中文分词的特征选择及模型优化研究
3.1食品安全语料库说明
3.2实验方法
3.3实验过程可视化
3.4.1特征选择的介绍
3.4.2食品安全突发事件语料特点
3.4.3面向食品安全突发事件中文分词的特征选择
3.5特征模版的构建和优化
3.6实验结果分析
3.7本章小结
第4章基于深度学习的食品安全突发事件中文分词
4.1双向LSTM模型介绍
4.1.1循环神经网络模型介绍
4.1.2双向循环神经网络模型介绍
4.1.3双向LSTM介绍
4.2词向量介绍
4.3过拟合和欠拟合
4.3.1过拟合和欠拟合介绍
4.3.2 Dropout方法
4.4基于双向LSTM的食品安全突发事件语料分词
4.4.1实验数据介绍
4.4.2实验数据处理
4.4.3实验方法
4.4.4实验结果分析
4.5 CRF模型与BLSTM模型在中文分词实验中的比较
4.5.1训练数据
4.5.2模型构建工具
4.5.3在计算资源与训练时长
4.5.4分词结果
4.5本章小结
5.1总结
5.2展望
参考文献
致谢
攻读学位期间发表的论文
南京农业大学;