首页> 中文会议>第二十三届中国数据库学术会议（NDBC2006） >一种新的基于BMM和RMM分词方法的研究与实现

一种新的基于BMM和RMM分词方法的研究与实现

页面导航

摘要
著录项
相似文献
相关主题

摘要

汉语自动分词是汉语信息处理的前提,也是一个极其复杂的过程.汉语自动分词的最终目的是为"计算机理解"服务的,因此在分词过程中,能保证一定程度上的精度要求,又能易于实现,这是值得研究的.同时,最大匹配法的原则是"长词优先",现有的最大匹配方法是在局部范围进行最大匹配,即每次最大匹配的范围都是建立在最先几个或最后几个汉字串,这样并没能充分体现"长词优先"的原则.基于以上这些讨论,本文提出了改进之后的正向最大匹配分词算法和逆向最大匹配分词算法,其核心思想就是在整个句子范围内寻找最长词.经测试并比较改进之前和改进之后的结果,具有歧义切分的句子数量明显减少,使得分词精度有一定程度的提高。

著录项

来源
《第二十三届中国数据库学术会议（NDBC2006）》|2006年|95-97110|共4页
会议地点广州
作者
赵伟; 路永刚; 吴琼;
展开▼
作者单位

中国计算机学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;专家系统、知识工程;
关键词
汉语信息处理; 中文自然语言理解; 机械分词; 专家系统; 最大匹配法;

相似文献

中文文献
外文文献
专利

1. 一种新的BMM-ESD电流解析式计算方法 [J] . 周峰 ,徐丹 ,黄久生 . 高电压技术 . 2007,第5期
2. 一种改进的MM分词方法的研究与实现 [J] . 路永刚 ,赵伟 . 长春工业大学学报（自然科学版） . 2006,第004期
3. 基于条件随机场的藏语自动分词方法研究与实现 [J] . 李亚超 ,加羊吉 ,宗成庆 . 中文信息学报 . 2013,第004期
4. 一种新的错误驱动学习方法在中文分词中的应用 [J] . 夏新松 ,肖建国 . 计算机科学 . 2006,第003期
5. 基于新统计量mt的汉语自动分词方法研究 [J] . 黄鑫 ,朱征宇 ,谢祈鸿 . 微处理机 . 2008,第001期
6. 一种改进的基于海量智能分词的中文自动分词算法 [C] . 赵琳瑛 ,赵捧未 . 第五届中国管理科学与工程论坛 . 2007
7. 一种新的并发分词算法的研究与实现 [A] . 李卫红 . 2004

一种新的基于BMM和RMM分词方法的研究与实现

摘要

著录项

相似文献

相关主题

期刊订阅