中文非受限领域自动文摘研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着社会的进步，科学技术的发展越来越着眼于人民大众，自动文摘的研究也应该为普通大众服务。而普通大众所需求的信息是广泛的，是不限领域的，因此面向非受限领域的自动文摘研究更是迫在眉睫。
　　研究了特征词及句子的加权算法，对现有的加权算法进行了改进，提出了特征词和句子加权的新算法：对特征词的加权，综合考虑了特征词在文档中的频率、在文档集中的频率、词长、位置以及是否为大写英文字母等特征；对句子的加权，综合考虑了句子在文档中的位置、句法结构以及是否有提示性短语等五种特征，并通过试验给出了句子五种特征相应的权值比例系数。另外还考虑了句子所在段落的重要度，对于重要段落中的句子适当加大了权值。
　　结合自动文摘的研究现状，采用概率统计的方法，用新的特征词和句子加权算法代替传统的算法，实现了中文非受限领域的自动文摘系统。
　　利用自建的文档集采用内部评价方法对开发的中文非受限领域自动文摘系统进行评价，结果表明该系统提取的文摘质量达到了预期效果，验证了所提出的中文非受限领域的自动文摘系统的有效性。分析了可能影响文摘质量的因素，为进一步完善文摘系统提供参考。

著录项

作者
李新兴;
展开▼
作者单位

河北大学;

展开▼
授予单位河北大学;
学科语言学及应用语言学
授予学位硕士
导师姓名李新福;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;算法理论;
关键词
自动文摘; 特征词; 加权算法; 句法结构;

相似文献

中文文献
外文文献
专利

1. 受限领域的自动文摘方法研究 [J] . 耿增民 ,刘万春 ,朱玉文 . 北京理工大学学报 . 2006,第8期
2. 受限领域中文问答系统问句分析研究 [J] . 蒋昌金 ,彭宏 ,马千里 . 计算机工程与设计 . 2010,第011期
3. 受限领域问答系统的中文问句分析研究 [J] . 陈康 ,樊孝忠 ,刘杰 . 计算机工程 . 2008,第010期
4. 受限领域中文问答系统的中心句识别的研究 [J] . 赖擎 ,曹力立 . 计算机时代 . 2006,第002期
5. 受限领域中文文本主题标引系统研究 [J] . 顾益军 ,樊孝忠 ,于江德 . 计算机应用 . 2004,第001期
6. 非受限域中文自动化文摘系统的研究与实例 [C] . 王开铸 . 全国第三届计算语言学联合学术会议 . 1995
7. 受限领域内基于中文问句语义相关度计算的智能问答系统研究 [A] . 王新磊 . 2014

中文非受限领域自动文摘研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅