首页> 中文会议>第十一届全国计算语言学学术会议 >全词消歧的序列标注方法

全词消歧的序列标注方法

页面导航

摘要
著录项
相似文献
相关主题

摘要

词义消歧，即在特定的上下文中确定歧义词的词义。全词消歧(All-Words Word Sense Disambiguation)本质上是一个序列标注问题,本文提出了两种用于全词消歧的序列标注方法,它们分别基于隐马尔可夫模型(Hidden Markov Model,HMM)和最大熵马尔可夫模型Maximum Entropy Markov Model,MEMM模型.首先,用HMM对全词消歧进行建模.然后,针对HMM只能利用观察值的缺点,将上述HIM模型推广为MEMM模型,将大量上下文特征集成到模型中.对于全词消岐这类超大状态问题,在HMM和MEMM模型中均存在数据稀疏和时间复杂度过高的问题,通过柱状搜索Viterbi算法和平滑策略来解决.最后,在Senseval-2和Senseval-3的数据集上进行了评测,本文提出的MEMM方法的性能超过该评测上所有的序列标注方法.

著录项

来源
《第十一届全国计算语言学学术会议》|2011年|173-179|共7页
会议地点洛阳
作者
Zhou Yun; 周云; Wang Ting; 王挺; Yi Mianzhu; 易绵竹; Wang Zhiyuan; 王之元;
展开▼
作者单位

中国中文信息学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;
关键词
信息处理; 全词消歧; 序列标注方法; 隐马尔可夫模型; 最大熵马尔可夫模型;
入库时间 2022-08-17 10:24:43

相似文献

中文文献
外文文献
专利

1. 基于序列标注的全词消歧方法 [J] . 周云 ,王挺 ,易绵竹 . 中文信息学报 . 2012,第002期
2. 中文全词消歧在机器翻译系统中的性能评测 [J] . 王博 ,杨沐昀 ,李生 . 自动化学报 . 2008,第005期
3. 基于双词主题模型的半监督实体消歧方法研究 [J] . 张雄 ,陈福才 ,黄瑞阳 . 电子学报 . 2018,第003期
4. 藏语同形异音词的消歧方法研究 [J] . 拉巴顿珠 ,欧珠 ,祖漪清 . 中文信息学报 . 2018,第007期
5. 维吾尔语多音词消歧混合方法 [J] . 姑丽加玛丽·麦麦提艾力 ,艾斯卡尔·肉孜 ,艾斯卡尔·艾木都拉 . 计算机工程与应用 . 2011,第035期
6. 中文情感词倾向消歧 [C] . 孙慧 ,关毅 ,董喜双 . 第六届全国信息检索学术会议 . 2010
7. 基于多资源的同义词和下位词抽取及在人名消歧中的应用 [A] . 范庆虎 . 2014

全词消歧的序列标注方法

摘要

著录项

相似文献

相关主题

期刊订阅