首页> 中文学位 >基于特定领域的汉语文本分析模型的设计与实现
【6h】

基于特定领域的汉语文本分析模型的设计与实现

代理获取

目录

文摘

英文文摘

第一章绪论

1.1自然语言处理及关键技术

1.2汉语处理中的特殊问题和HNC

1.3项目背景

1.4本文的工作

1.5本文的构成

第二章关键技术讨论

2.1方法的提出

2.2基础理论介绍

2.2.1 Fillmore的格语法

2.2.2骨架分析法

2.2.3北大《现代汉语语法信息词典》

第三章系统整体框架

第四章主要数据准备

4.1 POS集和纠错规则

4.2分语义场的设计

4.3词汇语义码映射库

4.4动词或形容词的静态语法信息库

4.5各种词类的搭配信息库

4.5.1动词形容词的搭配信息库

4.5.2名词搭配关系信息库

4.5.3介词搭配关系信息库

第五章算法描述

5.1确定句子的谓语中心词

5.2借助词汇搭配信息的句子分析过程

5.2.1对象的分析函数

5.2.2具体分析过程举例

5.2.3异常回溯处理模块

5.3结果和输出

第六章讨论

6.1系统的评测

6.2同其它系统的比较

6.3存在的问题

参考文献

致谢

攻读硕士学位期间发表的学术论文

展开▼

摘要

该文作者借鉴了许多国内外专家学者的理论和研究成果,从人类理解语言的根本出发,重视概念知识在文本分析过程中的作用,提出了一种基于特定领域的知识表示模型和文本分析方法.该知识表示模型以C.J.Fillmore的格语法为基础,主要描述了词汇的搭配信息.基于该知识表示模型的文本分析方法,将句法分析和语义分析结合在一起,在很大程度上模拟了人的理解过程,在解决汉语短语结构嵌套问题上效果尤为显著.作者将这种知识表示模型和文本分析算法应用于足球比赛报导领域,设计实现了一个小型的文本分析系统.该系统用JBuilder4.0开发,用XML1.0构建数据库.目前系统正处于测试阶段,初步的实验取得了令人满意的结果.该文首先介绍了该研究领域的关键技术,然后讨论了该文本分析方法的提出和其基于的理论依据.在第三章介绍了系统的整体框架,第四、五两章介绍了足球比赛报导领域中的知识表示模型和文本分析算法的设计.最后对这种计算模型进行了总结,并将其与其它两个系统进行比较,对其存在的不足之处进行了讨论.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号