首页> 中文学位 >面向新媒体的新闻缩写关键技术研究
【6h】

面向新媒体的新闻缩写关键技术研究

代理获取

目录

声明

摘要

1.1 研究背景和意义

1.2 国内外研究现状

1.3 论文的主要工作

1.4 论文的组织形式

第2章 相关理论及方法

2.1 新闻缩写的预处理技术

2.1.1 中文分词

2.1.2 命名实体识别

2.1.3 句法分析

2.2 缩写常用算法模型

2.2.1 噪声信道模型

2.2.2 剪枝模型

2.2.3 同步树替代文法模型

2.3 摘要提取相关算法

2.3.1 整数线性规划

2.3.2 句子增强技术

2.3.3 社交网络打分机制

2.4 本章小结

3.1 研究概述

3.2 新闻标题缩写算法

3.2.1 词对齐技术

3.2.2 基于GIZA++的词对齐

3.2.3 基于同义词林的词对齐

3.2.4 基于规则与统计的句子压缩算法

3.3 基于关键词的启发式句子压缩算法

3.3.1 关键词提取

3.3.2 启发式的语言学规则

3.3.3 压缩结果修复

3.4 本章小结

第4章 基于句子多特征与冗余处理的新闻正文压缩算法

4.1 研究概述

4.2 句子权重计算

4.2.1 基于特征融合的词语权重

4.2.2 句子多特征

4.2.3 句子权重值

4.3 句子相似度计算

4.4 基于整数线性规划的句子选择算法

4.5 本章小结

第5章 实验系统原型设计与结果分析

5.1 实验环境

5.2 实验系统原型设计

5.3 实验结果分析

5.3.1 新闻标题缩写算法实验分析

5.3.2 新闻正文摘要抽取及缩写实验分析

5.4 本章小结

结论

参考文献

致谢

展开▼

摘要

随着新媒体的快速发展,网络新闻呈现出雨后春笋的态势,人们面临信息选择困难、信息超载等问题。大量的冗余信息一方面增加了用户阅读信息的时间,另一方面还增加了用户发现和理解热点话题的困难。
  移动设备的普及更是带动了新闻客户端的大量产生,这些移动设备的特点是屏幕小,信息量过大时不能单屏显示,分屏又会导致阅读的不便。因此,新闻自动缩写技术应运而生,新闻缩写不仅可以获得简约而明了、有深度且有态度的内容资源,而且能提升网络新闻的品质,实现网络新闻的增值阅读。
  本文对新闻标题和新闻正文的缩写技术展开一系列研究。针对新闻标题,借助于词对齐技术应用规则与统计结合的方法进行压缩。针对新闻正文内容,提出句子压缩与句子选择结合的框架来生成新闻正文的压缩结果。该框架中,首先应用句子多特征融合的方法进行摘要句子预选择,根据句子多特征权重排序抽取最具有代表性的句子。然后针对预选择的摘要句子,提出一种基于关键词的启发式句子压缩算法,该算法作为中间阶段被应用于生成原句子的压缩变体。最后通过整数线性规划算法去除冗余,选取出信息量最大的最终新闻摘要。
  在评测方面,本文提出一种句子压缩基础上的自动摘要评测方法。该方法通过信息的重要性、语法规范性和压缩比对压缩后的句子进行打分,随后在摘要的评测中结合句子压缩分数计算出准确率、召回率以及F值分别为79.26%、76.32%和77.76%。实验结果表明,本文提出的新闻缩写算法切实可行,能对给定的新闻文章自动生成一段连贯且具有象征性的高密度新闻摘要。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号