首页> 中文学位 >中文分词中歧义字段切分的研究
【6h】

中文分词中歧义字段切分的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

§1-1课题背景

§1-2国内外研究现状

§1-3论文研究的内容

§1-4论文的结构

第二章 中文分词中的歧义字段的研究分析

§2-1歧义字段概述

§2-2对歧义字段的切分的分词法及其分析

§2-3本章小结

第三章 中文分词中歧义字段切分的BP网络的分析和改进

§3-1神经网络

§3-2基于BP网络中文歧义切分模型

§3-3 基于BP网络歧义切分算法的优缺点分析

§3-4 BP网络的改进分析研究

§3-5本章小结

第四章 基于改进的BP神经网络歧义切分算法的研究

§4-1 改进的BP网络算法的实现

§4-2 改进的BP网络算法的中文歧义切分模型的实现

§4-3 本章小结

第五章 实验结果及比较

§5-1对比实验及分析

§5-2 本章小结

第六章 结论及展望

§6-1结论

§6-2工作展望

参考文献

致谢

展开▼

摘要

论文对国内现有的几种汉语自动分词中的歧义字段切分算法进行讨论,重点分析了BP神经网络的局限,提出了改进,建立了新的BP网络歧义切分模型,使其对于歧义字段的切分精度和效率进一步的提高,为中文分词领域的扩展开阔了新天地。
  首先,论文指出中文分词中一个棘手的问题就是歧义字段的切分,并介绍了歧义字段产生的原因以及类别,分析研究常见的三种分词方法针对歧义切分的优缺点,得出最适合高效切分歧义字段的分词算法是基于神经网络的分词法的结论。
  其次,论文对神经网络分词法的核心算法BP网络做了详细的阐述,在此基础上建立BP网络的歧义切分模型并对其模型如何进行歧义字段的切分做了详细的解释。然后,对切分模型的优缺点分析,针对其缺点提出改进算法,形成了以BP网络中梯度下降法为核心的,采用分层自适应学习率代替固定的学习率,在一定条件下融合模拟退火算法的新算法。在新算法的基础上建立新的歧义切分模型。
  最后,论文进行新旧模型的对比实验。实验数据表明,改进后的新模型不仅克服了传统歧义切分模型的缺点,而且在切分准确率上和切分时间效率上都有明显的提升。同时,对全文工作做了总结,并提出了进一步的研究方向。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号