基于混合机器学习模型的多文档自动摘要

唐晓波; 翟夏普

首页> 中文期刊> 《情报理论与实践》 >基于混合机器学习模型的多文档自动摘要

基于混合机器学习模型的多文档自动摘要

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

[目的/意义]信息过载是当前社会面临的普遍性问题,如何从大量的信息中提取有价值的内容,已成为研究的一个重点,目前自动摘要技术成为解决此问题的一种途径.[方法/过程]为了解决多文档摘要信息不全面、冗余度高的问题,文章提出了针对中文文本的多文档自动摘要混合模型,并对该模型所包含的句子向量化、分类器分类、句群划分和句子重组四个部分做了详细说明.该混合模型在摘要提取的过程不仅考虑了句子的形式特征,还融合了句子的深层语义,最后采用基于改进的PageRank算法对摘要句进行重组.[结果/结论]当摘要句为30时,该模型的ROUGE-1得分平均值为0.2074,明显高于TextRank (0.0728)和基于聚类的算法(0.1074).实验结果表明该模型在多主题的中文长文本上是有效的.[局限]由于中文语料的限制,本实验的数据量相对较小,模型的适应能力未在大数据集上验证.

著录项

来源
《情报理论与实践》 |2019年第2期|145-150|共6页
作者
唐晓波; 翟夏普;
展开▼
作者单位

武汉大学信息管理学院,湖北武汉430072;

武汉大学信息资源研究中心,湖北武汉430072;

武汉大学信息管理学院,湖北武汉430072;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
混合机器学习; 多文档摘要; 语义结构模型; 信息抽取;

相似文献

中文文献
外文文献
专利

1. 基于完全稀疏主题模型的多文档自动摘要 [J] . 邵洲 ,张晖 . 计算机工程与设计 . 2014,第003期
2. 基于稀疏表示的多文档自动摘要 [J] . 钱玲龙 ,武娇 ,王人锋 . 计算机科学 . 2020,第0z2期
3. 基于M-C-G神经网络的多文档自动摘要方法 [J] . 高阳 ,闫仁武 ,袁双双 . 软件导刊 . 2020,第010期
4. 基于查询的新闻多文档自动摘要技术研究 [J] . 王凯祥 ,任明 . 中文信息学报 . 2019,第004期
5. 基于LDA与TextRank结合的多文档自动摘要研究 [J] . 张波飞 ,李成城 . 软件导刊 . 2018,第004期
6. 基于主题模型LDA的多文档自动摘要 [C] . 杨潇 ,马军 ,杨同峰 . 第五届全国信息检索学术会议CCIR2009 . 2009
7. 基于短语主题模型和多文档自动摘要技术文献综述内容推荐 [A] . 张占江 . 2016

基于混合机器学习模型的多文档自动摘要

摘要

著录项

相似文献

相关主题

期刊订阅