基于全切分和碎片提取的中文自动分词系统

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

中文自动分词是中文自然语言处理的一项基础性工作，也是中文信息处理的一个重要问题，在很多领域扮演着非常重要的角色。中文自动分词系统是利用计算机对中文文本进行词语自动切分的系统。我国很早就开始了这一方面的研究工作，己经取得了很多成果，涌现出大量的基于各种算法的分词系统。但是真正满足实际需要的分词系统还没有出现，有待于进一步深入探讨。本文对已经出现的分词算法进行了总结，对各种算法进行了优缺点的分析，并结合汉语本身的特点指出了影响分词系统性能提高的主要因素。本文的主要工作是：针对中文分词系统实现中的主要难点——歧义切分和未登录词识别，进行了一些有意义的探讨，提出了一种基于改进的全切分算法的粗分模型和基于碎片提取的未登录词处理相结合的方法。按照通用的、已经成为标准的分词系统评价标准(准确率P，召回率R和平均值F)，对基于该方法的分词系统进行了小规模开放测试，试验取得了比较好的结果，说明该方法对以后的自动分词研究有一定的参考价值。文章的最后分析了系统中存在的问题，并提出了对未来分词系统的展望。

著录项

作者
陶振宇;
展开▼
作者单位

南开大学;

展开▼
授予单位南开大学;
学科模式识别与智能系统
授予学位硕士
导师姓名周玉龙;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
中文自动分词; 改进全切分; 碎片提取; 未登录词; 自然语言处理;
入库时间 2022-08-17 11:19:10

相似文献

中文文献
外文文献
专利

1. 设立切分标志法在中文地址自动分词中的改进与应用 [J] . 刘韬 . 电脑知识与技术 . 2009,第011期
2. 汉语自动分词系统中切分歧义与未登录词的处理策略 [J] . 韩维良 . 青海师范大学学报（自然科学版） . 2004,第002期
3. 自动答疑系统中文自动分词模块设计与实现 [J] . 阙玲丽 . 电子技术与软件工程 . 2018,第005期
4. 基于DRIS系统中的中文自动分词模块设计与实现 [J] . 张昭楠 ,马亚蕾 . 电子设计工程 . 2016,第014期
5. 中文自动分词系统概述 [J] . 马婷婷 . 电脑知识与技术 . 2010,第033期
6. 钢基硬质合金组合轧辊在φ12mm三切分预切分架次中的应用 [C] . LI Jun ,李军 ,XU Su-wen . 第六届中国金属学会青年学术年会 . 2012
7. 脱机手写中文识别中粘连文本行的切分与提取 [A] . 周宇 . 2007

基于全切分和碎片提取的中文自动分词系统

目录

摘要

著录项

相似文献

相关主题

期刊订阅