首页> 中文学位 >汉语动词词语搭配自动获取方法研究
【6h】

汉语动词词语搭配自动获取方法研究

代理获取

目录

文摘

英文文摘

第一章绪论

第二章基于非完备决策表的兼类词词性校对规则自动获取

第三章汉语动宾搭配方法比较研究

第四章基于最大熵模型的汉语动动搭配获取

第五章结论与展望

参考文献

附录 信息处理用现代汉语词类标记集

发表文章目录

致谢

个人简况及联系方式

承诺书

展开▼

摘要

在自然语言处理领域中,句法分析是实现语言“理解”的必然环节,也是公认的一个重点和难点。面向依存文法的句法分析方法主要是通过获取句子的核心动词及其所支配的词语搭配,进而分析句子内词语之间的依存关系,以建立依存句法树。依存语法认为动词是句子的中心,动词在汉语句子中起支配作用,因此动词组合框架的研究能为自动句法分析和处理提供较好的基础。 本文主要基于语料库的动词词语搭配自动获取方法进行了研究和实验。 (1)由于目标动词和搭配词的词性标注在搭配获取工作中占有重要地位,因此,作为基础性工作,我们首先研究了词性标注中兼类词的排歧问题。利用粗糙集约简理论提出了一种基于非完备决策表的兼类词标注校对规则获取方法,以作为基于软件的词性标注结果的辅助校对工具,旨在提高兼类词词性标注的正确率,为获得高质量的语料库提供基础。 (2)在确保高质量语料库基础的前提下,探讨了面向依存语法分析的动宾搭配自动获取的方法。通过对已有方法的概括,在词语搭配上重点研究并分析了互信息、Cosine系数、x2测试、似然比4种较优的词语度量方法,比较了方差、离散度、熵3种结构度量方法优劣。随后提出了一种基于互信息和信息熵融合的搭配获取方法,将其应用到动名、动动搭配的获取,在高频下取得了较好的效果。 (3)首次将最大熵模型应用于动词词语搭配的获取。以动动搭配的获取为着眼点,抽取搭配词对的上下文词性信息及其关联程度的统计信息构造候选复合特征模板,结合粗糙集理论的约简技术,获得训练最大熵模型的最简特征模板。一系列实验证明,基于最大熵模型的动动搭配的获取方法是可行的。 最后,对动词词语搭配获取的未来研究进行了展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号