基于生成性词库分词技术的汉语拼音自动转换研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文的研究目标是为上层语言应用，比如语音输出、拼音读物排版系统、对外汉语教学等，提供一个高效率、高准确度的把汉字文本自动转换成汉语拼音的算法。算法的核心是识别汉字的多音字。本文通过研究，发现只有在词处理层面才能较好地识别多音字。因此，第一步的工作是进行自动分词的研究，这个研究是建立在优化和完善湖南大学罗海清的生成性词库分词技术上的。通过扩充基本语素以及对应的前加语素和后加语素、增加专业名称和成语词表等研究，大幅度地提高了分词的准确度。第二步，在自动分词的基础上，采集了GB2312字符集中所有的多音字和它们对应的词，设计算法把汉字词转换成汉语拼音词，同时在程序中还对音变进行了处理。通过不断地试验，最终的汉字文本转汉语拼音程序能达到99％的准确度，基本满足了实际应用的需求。

著录项

作者
罗万;
展开▼
作者单位

湖南师范大学;

展开▼
授予单位湖南师范大学;
学科语言学及应用语言学
授予学位硕士
导师姓名彭泽润;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字学;
关键词
汉语拼音; 自动转换法; 自动分词; 汉字识别;

相似文献

中文文献
外文文献
专利

1. 基于词库与词法的分词不一致研究 [J] . 董宇 ,陈小荷 . 浙江外国语学院学报 . 2008,第003期
2. 一种基于三级索引词库结构的中文分词方法研究 [J] . 段小斌 ,林雯 ,阮百尧 . 计算机与数字工程 . 2007,第007期
3. 基于形成性评价体系的中药学学术学位研究生培养模式研究 [J] . 余格 ,李原华 ,赵靖 . 卫生职业教育 . 2020,第008期
4. 基于形成性评估的研究生医学英语课程教学与评估体系研究 [J] . 王健 ,李蟠 ,王文标 . 继续医学教育 . 2017,第006期
5. 基于本体的数据分词技术及配网调度智能成票关键技术的研究 [J] . 王群飞 . 电工技术 . 2021,第001期
6. 基于情报检索语言互操作的集成词库构建——以教育集成词库为例 [C] . 刘华梅 . 全国第五次情报检索语言发展方向研讨会 . 2009
7. “隐性小词表+专业小词库”的自动分词技术研究 [A] . 刘阳 . 2007

基于生成性词库分词技术的汉语拼音自动转换研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅