基于MapReduce并行计算提取文档特征Textrank算法研究

孙龙; 李彦

首页> 中文期刊> 《现代信息科技》 >基于MapReduce并行计算提取文档特征Textrank算法研究

基于MapReduce并行计算提取文档特征Textrank算法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Textrank相比词袋模型有独特的优势,但需要进行多轮迭代和递归运算,常规串行化算法无法满足大数据环境下文档处理的需求.必须借助大数据的分布式处理、并行化计算技术来应对这一挑战.本文学习研究了大数据平台Hadoop的分布式处理方式,并在MapReduce框架下实现并行了Textrank并行提取文档特征的算法.同时,本文就Textrank中关键的投票算法提出了MapReduce迭代实现.经在Hadoop集群上验证,在计算节点增加的情况下,该模式可有效提升Textrank算法效率.

著录项

来源
《现代信息科技》 |2018年第10期|80-83|共4页
作者
孙龙; 李彦;
展开▼
作者单位

四川大学计算机学院,四川成都 610065;

四川大学制造科学与工程学院,四川成都 610065;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
MapReduce; Textrank; 文档特征提取;

相似文献

中文文献
外文文献
专利

1. 基于MapReduce并行计算提取文档特征Textrank算法研究 [J] . 孙龙 ,李彦 . 现代信息科技 . 2018,第010期
2. 基于多元特征加权改进的TextRank关键词提取方法 [J] . 余本功 ,张宏梅 ,曹雨蒙 . 数字图书馆论坛 . 2020,第003期
3. 基于SVM的融合多特征TextRank关键词提取算法 [J] . 朱衍丞 ,蔡满春 ,芦天亮 . 软件导刊 . 2020,第002期
4. 基于TextRank的网评产品特征提取方法 [J] . 何金金 ,郭振波 ,王开西 . 青岛大学学报（自然科学版） . 2018,第001期
5. 基于MapReduce的互联网拓扑特征参数算法研究 [J] . 朱凯龙 ,陆余良 ,张岩庆 . 计算机科学 . 2017,第006期
6. 基于TextRank的多文档关键词抽取技术 [C] . . 第四届全国信息检索与内容安全学术会议 . 2008
7. 基于TextRank算法的中文文献自动摘要提取研究 [A] . 赵君 . 2019

基于MapReduce并行计算提取文档特征Textrank算法研究

摘要

著录项

相似文献

相关主题

期刊订阅