基于支持向量机的英语情态动词Will语义排歧研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

语义排歧是指根据目标词出现的上下文语境自动识别其意义。语义排歧是机器翻译、信息检索、语音识别、文本分类以及人机交互等诸多领域中的关键环节，是自然语言处理领域的热点和难点。尽管语义排歧技术取得了很大发展，但目前的语义排歧研究对象还是主要集中在普通动词和名词的语义排岐上。情态表达说话人的态度和意见，主要由情态动词来实现。因此，正确识别情态动词的语义对理解和领会说话人的态度和意见十分重要。情态动词语义有三种不确定性：梯度，歧义和融合。这些不确定性使人们很难把握其准确意义。因此，建立一个有效的、准确性较高的情态动词语义排歧模型变得至关重要。
　　本研究基于120万字的语料库，从will的实际使用语境中提取八个语义特征和句法特征，并采用数据挖掘中的一种新方法——支持向量机，建立了情态动词 will的语义排歧模型。实验结果显示，由支持向量机方法建立的情态动词will的语义排歧模型的排歧精度达到了98.33％。这个结果，证实了采用支持向量机对情态动词 will语义排歧的有效性，同时证明了从真实的语料库中提取的8个语言特征的有效性。为了验证支持向量机语义排歧效果的优越性，本文采用神经网络技术中的反向传播神经网络，径向基神经网络和概率神经网络方法，分别建立了情态动词 will的语义排歧模型。对以上四个排歧模型的训练和检验结果对比分析发现，由支持向量机建立的情态动词 will的语义排歧模型的泛化能力在实际应用中比人工神经网络技术的泛化能力要更加稳定和可靠。由概率神经网络建立的语义排歧模型的泛化能力要优于径向基神经网络和反向传播神经网络。径向基神经网络的泛化能力又优于反向传播神经网络。另外，本文对情态动词 will语义排歧中出现错误排岐的原因进行了分析。
　　在此基础上，确定了不同语言特征对情态动词 will的语义排歧效果的影响程度。在原来的模型中先后删除语义信息特征和句法信息特征，建立模型，训练和检验，并将检验结果与原模型的检验结果对比。实验结果表明，语义信息特征对情态动词语义排歧效果影响大于句法信息特征的影响。其中，情态动词 will与其后的动词的互信息特征对排歧效果的影响程度最大。通过采用特征提取算法，F-score算法，得出根意义的will与其后的动词的互信息、认知意义的will与其后的动词的互信息、第三人称以及第一人称是影响情态动词 will的语义排歧效果的最重要的四个特征。经实验证明，其算法得出的结果是可靠的。
　　情态动词 will语义排歧模型的成功建立，不仅有助于实现语料库的自动语义标注，减轻研究人员的劳动负担，而且有助于提高机器翻译的质量。从语料库中提取的识别情态动词 will语义的八个有效语言特征，为判断和识别情态动词will的语义提供了客观依据。

著录项

作者
黄亮;
展开▼
作者单位

燕山大学;

展开▼
授予单位燕山大学;
学科英语语言文学
授予学位硕士
导师姓名于建平;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类语法;人工神经网络与计算;
关键词
支持向量机; 英语情态动词; 语义排歧; 人工神经网络; 特征提取;

相似文献

中文文献
外文文献
专利

1. 英语情态动词语义排歧中的知识发现研究 [J] . 李洪波 ,于建平 . 电脑知识与技术 . 2019,第012期
2. 关于英语情态动词语义排歧中的知识发现分析 [J] . 黄雪梅 . 新丝路:上旬 . 2020,第007期
3. 共现语境特征对情态动词语义排歧的限制作用 [J] . 于建平 ,孙亚楠 ,孙锐 . 江苏科技大学学报（自然科学版） . 2019,第006期
4. 基于神经网络的语境特征对must语义排歧影响研究 [J] . 于建平 ,付继林 ,白塔娜 . 软件导刊 . 2020,第005期
5. 基于词元语义特征的汉语框架排歧研究 [J] . 李国臣 ,张立凡 ,李茹 . 中文信息学报 . 2013,第004期
6. 基于语义规则的汉语短语结构分析排歧初探 [C] . 郑旭玲 ,李堂秋 ,杨晓峰 . 全国第六届计算语言学联合学术会议 . 2001
7. 基于人工神经网络构建英语情态动词may的语义排歧模型 [A] . 张剑 . 2008

基于支持向量机的英语情态动词Will语义排歧研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅