首页> 中文会议>中国中文信息学会二十周年学术会议 >基于转换的错误学习方法的汉语词性自动标注研究

基于转换的错误学习方法的汉语词性自动标注研究

页面导航

摘要
著录项
相似文献
相关主题

摘要

词性标注是自然语言处理的基础.本文采用了基于规则与统计相结合的标注方法.首先用基于词性与词相结合的三元统计模型对汉语分词及标注进行一体化处理,完成对语料库的初始标注;然后用Brill的基于转换的学习方法通过转换规则完成最终的词性标注.对大规模真实语料的标注实验表明基于转换的方法与三元统计模型方法相得益彰;高起始点的初始标注对于提高Brill方法的准确性至关重要;Brill的基于转换的方法在高精度的初始标注的基础上又有明显的提高.

著录项

来源
《中国中文信息学会二十周年学术会议》|2001年|140-147|共8页
会议地点北京
作者
张艳; 徐波;
展开▼
作者单位

中国中文信息学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;现代汉语;
关键词
词性标注; 三元统计模型; 错误驱动; 学习算法; 汉语词性;

相似文献

中文文献
外文文献
专利

1. 基于隐Markov模型汉语词性自动标注的新算法 [J] . 曲慧雁 ,赵伟 ,王东海 . 东北师大学报：自然科学版 . 2013,第4期
2. 基于隐Markov模型汉语词性自动标注的若干分析与改进 [J] . 王东海 ,赵伟 ,陈洁 . 长春工业大学学报（自然科学版） . 2007,第001期
3. 一种基于改进的最大熵模型的汉语词性自动标注的新方法 [J] . 赵伟 ,赵法兴 ,王东海 . 计算机研究与发展 . 2006,第0z3期
4. 基于统计的汉语词性自动标注方法 [J] . 白栓虎 . 语文建设 . 1994,第010期
5. 基于转换的错误驱动学习的藏语词性标注研究 [J] . 拉毛杰 ,安见才让 . 计算机时代 . 2019,第012期
6. 一种基于改进的最大熵模型的汉语词性自动标注的新方法 [C] . 赵伟 ,长春工业大学计算机科学与工程学院 ,赵法兴 . 第二十三届中国数据库学术会议（NDBC2006） . 2006
7. 基于统计的汉语词性自动标注的若干分析与实验研究 [A] . 王东海 . 2007

基于转换的错误学习方法的汉语词性自动标注研究

摘要

著录项

相似文献

相关主题

期刊订阅