首页> 中文会议>全国第六届计算语言学联合学术会议 >基于三元统计模型的汉语分词及标注一体化研究

基于三元统计模型的汉语分词及标注一体化研究

页面导航

摘要
著录项
相似文献
相关主题

摘要

汉语的分词及词性标注是汉语语言处理的基础.虽然,该领域在过去十年已经有了很大进展,但高精度的面向大规模真实文本的分词及标注仍然存在许多困难.本文提出一种基于三元统计模型的汉语分词标注的方法,旨在并行考虑词性及词汇的三元概率模型,兼顾词及词性之间的搭配,实现分词和78类二级词性标注的整体最优,实验结果显示该方法获得很高的正确率.

著录项

来源
《全国第六届计算语言学联合学术会议》|2001年|116-122|共7页
会议地点太原
作者
高山; 张艳; 徐波; 宗成庆; 韩兆兵;
展开▼
作者单位

中国中文信息学会;

中国计算机学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;
关键词
分词; 词性标注; 三元统计模型; 语言信息处理;
入库时间 2022-08-17 10:20:01

相似文献

中文文献
外文文献
专利

1. 基于CRF的先秦汉语分词标注一体化研究 [J] . 石民 ,李斌 ,陈小荷 . 中文信息学报 . 2010,第002期
2. 基于弱标注数据的汉语分词领域移植 [J] . 朱运 ,李正华 ,黄德朋 . 中文信息学报 . 2019,第009期
3. 基于CRF的古汉语分词标注模型研究 [J] . 严顺 . 江苏科技信息 . 2016,第008期
4. 基于三词位的字标注汉语分词 [J] . 王希杰 ,黄勇杰 . 安阳师范学院学报 . 2013,第005期
5. 基于最大熵模型的词位标注汉语分词 [J] . 于江德 ,王希杰 ,樊孝忠 . 郑州大学学报（理学版） . 2011,第001期
6. 汉语分词及词性标注自动校验方法研究 [C] . 钱揖丽 ,张虎 . 第一届学生计算语言学研讨会 . 2002
7. 汉语分词中未登录词识别及词性标注的研究与实现 [A] . 张国兵 . 2008

基于三元统计模型的汉语分词及标注一体化研究

摘要

著录项

相似文献

相关主题

期刊订阅