基于避免交集型歧义的最大匹配算法改进的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在当今信息化世界中，中文信息处理技术已经在各个领域中得到了广泛的应用。本文主要对中文分词算法中的基于分词词典机制的最大匹配算法进行研究讨论。由于中文语法语义复杂导致大量歧义字段的出现，文章中提出的最大匹配改进算法是针对分析原有的最大匹配算法的弊端以及避免交集型歧义字段在切分中出现错误而改进的，该算法在保证一定切分速率的基础上提高了中文切分的准确率。
　　本文描述的中文分词算法是基于避免交集型歧义字段的最大匹配算法的改进算法。文中首先介绍了目前的中文分词算法，其中就常用的分词算法、分词词典机制以及歧义字段相关理论三部分来详细讲解目前中文分词算法的基本理论；其次根据已有分词词典机制描述了基于Hash表的反向词典机制；在提出的反向分词词典机制的基础上改进了最大匹配算法，提出了基于避免交集型歧义的最大匹配算法的改进算法。
　　最后论文中实现了简单的中文分词系统，此系统用来进行基于避免交集型歧义字段的最大匹配改进算法实验，并且用此系统把四种算法进行了实验比较。实验结果证明基于避免交集型歧义字段的最大匹配改进算法具有较好的性能和实用性。但是由于本实验没有涉及对于未识别词的识别问题，所以实验结果并没有达到目前标准的准确率。

著录项

作者
康晨阳;
展开▼
作者单位

西安电子科技大学;

展开▼
授予单位西安电子科技大学;
学科计算机软件与理论
授予学位硕士
导师姓名郑有才;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类软件工程;
关键词
交集型歧义字段; 最大匹配算法; 中文信息处理; 中文分词算法; 分词词典机制;

相似文献

中文文献
外文文献
专利

1. 基于CFRs模型的交集型歧义消解研究 [J] . 尤慧丽 . 电脑知识与技术 . 2018,第018期
2. 一种基于无监督学习的交集型歧义处理改进方法 [J] . 黄鹏 ,张姝 ,陈玉华 . 云南师范大学学报（自然科学版） . 2015,第006期
3. 基于词典和语素的交集型歧义消除模型 [J] . 李春雨 ,王勇 . 微型机与应用 . 2013,第004期
4. 基于关联规则的交集型歧义消解算法 [J] . 袁鼎荣 ,钟宁 . 郑州大学学报（理学版） . 2010,第001期
5. 基于混合模型的交集型歧义消歧策略 [J] . 李天侠 ,戴新宇 ,陈家骏 . 计算机工程与应用 . 2008,第021期
6. 基于最大匹配和歧义检测的中文分词粗分方法 [C] . 李国和 ,刘光胜 ,吴卫江 . 2010全国文档信息处理学术会议 . 2010
7. 中文分词交集型歧义处理研究 [A] . 魏博诚 . 2011

基于避免交集型歧义的最大匹配算法改进的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅