基于统计的汉语词性标注方法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着计算机的发展,用自然语言作为人机交互语言已是必然趋势,这就对自然语言处理的深度和广度提出了越来越高的要求.词性标注是自然语言处理中的一项基础性题课,词性标注的正误对汉语语料库标注、机器翻译和大规模文本的信息检索等都有重要的意义.该文对词性标注的方法进行了研究,分析了基于规则的方法和基于统计的方法的优缺点.获得上下文信息的多少和数据平滑的程度是评价词性标注统计模型性能的两个重要的参数.针对以前统计模型获取上下文信息有限的缺点,给出了一种针对汉语词性标注的、扩展的完全二阶隐马尔可夫模型,该模型方法比标准的统计模型获得更多的上下文信息.同时,该文采用性能稳定的基于线性插值的平滑算法解决了三元模型严重的数据稀疏问题.由于模型获取词汇概率和词性概率参数方法的改变,相应的修改了Viterbi算法.实验证明,这种新的完全二阶隐马尔可夫模型比现有的模型更能有效地提高汉语词性标注的正确率和消歧率.

著录项

作者
梁以敏;
展开▼
作者单位

大连理工大学;

展开▼
授予单位大连理工大学;
学科计算机应用技术
授予学位硕士
导师姓名黄德根;
年度 2004
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理 ;
关键词
完全二阶隐马尔可夫模型; 汉语词性标注; 数据平滑; Viterbi算法;

相似文献

中文文献
外文文献
专利

1. 基于统计的汉语词性标注方法的分析与改进 [J] . 魏欧 ,吴健 ,孙玉芳 . 软件学报 . 2000 ,第004期
2. 基于双层条件随机场的汉语词性标注方法研究 [J] . 王艺帆 ,王希杰 . 安阳师范学院学报 . 2016 ,第005期
3. 基于条件随机场的汉语词性标注方法研究 [J] . 谷川 ,田喜平 . 安阳师范学院学报 . 2010 ,第005期
4. 基于德语语料库词性标注和统计方法的研究 [J] . 姚天昉 ,林莉 ,玉素甫.艾白都拉 . 上海交通大学学报 . 1996 ,第6期
5. 词性标注的方法研究——结合条件随机场和基于转换学习的方法进行词性标注 [J] . 阴晋岭 ,王惠临 . 现代图书情报技术 . 2009 ,第003期
6. 基于统计的汉语词性标注规则的获取技术 [C] . 张丽静 ,黄德根 . 2001全国软件技术研讨会 . 2001
7. 汉语词类划分与词性标注方法的研究 [A] . 张一哲 . 2011

基于统计的汉语词性标注方法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅