首页> 中文学位 >一种基于综合背景概念格的中文自动文摘方法
【6h】

一种基于综合背景概念格的中文自动文摘方法

代理获取

摘要

随着当前信息技术的发展以及Internet的普及,人们对诸如自动文摘这样的文本处理需求与日俱增。中文自动文摘研究起步较晚,加上中文自身的特点导致中文自动文摘技术成熟还尚需时日。
   本文首先总结、分析了自动文摘的国内外研究现状,在此基础上,提出了一种基于概念格理论实现中文自动文摘的方法,建立了自动文摘系统框架CBCL-TAS,重点阐述了基于文本实时分割的无词典抓词算法、中文特征提取方法及文本概念格建立算法,并在实验基础上对基于该方法构造的自动文摘系统进行了评价。本文提出的自动文摘方法利用综合文本背景建立与全文对应的概念“骨架”,将对自然语言的理解转换为对文本形式背景的理解,避免了复杂的语法语义、语句相似度计算、语句联系度计算等处理。对较大规模的文本进行抓词首先需要对文本进行分割,本文提出的抓词算法动态调整文本分割段的大小,与传统的固定分割式算法相比,对于50万字以上的较大文本具有更高的处理效率。
   实验结果表明,CBCL-TAS系统生成的中文文摘质量良好,尤其对于议论型体裁的文本,准确率较高。由于采用了实时分割式的抓词处理,避免了系统受到文本规模变化的影响,整体处理速度保持在较高水平。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号