基于PageRank的新闻关键词提取算法

顾亦然; 许梦馨

首页> 中文期刊> 《电子科技大学学报》 >基于PageRank的新闻关键词提取算法

基于PageRank的新闻关键词提取算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Most of the existing methods of extracting keyword based on complex networks ignore the natural language characters when building the weighted text network. In the meantime, they involve less the classical algorithms in complex network field. Based on PageRank algorithm, we propose a keyword extraction method, named LTWPR (located and TF-weighted PageRank), which takes into consideration term-frequency character and human language characters. The algorithm creates a term-frequency-shared weight in order to share the node's term-frequency value to its links, and defines a position weight coefficient to express different importance of words in different positions of news articles. LTWPR brings text networks' local and global features into consideration, making the results more accurate. Comprehensive experiments are conducted based on news articles grabbed from Sina News. Experimental results show that LTWPR algorithm is more effective and can better cover the keywords tagged by authors.%现有的基于复杂网络的关键词提取算法在构建加权文本网络时没有考虑文本的自然语言特性,且在提取关键词时较少涉及复杂网络领域经典算法.本文引入词频分享权重,利用词频特性为节点之间的连边加权.在此基础上,基于PageRank算法,并结合人类语言习惯特性定义位置权重系数,提出了一个新的新闻关键词提取算法——LTWPR算法,综合考虑了文本网络的局部特征和全局特征.采用新浪新闻语料进行了大量实验,结果表明该算法能够快速有效的覆盖新闻作者标注的关键词,且提取效果更佳.

著录项

来源
《电子科技大学学报》 |2017年第5期|777-783|共7页
作者
顾亦然; 许梦馨;
展开▼
作者单位

南京邮电大学自动化学院南京 210023;

南京邮电大学自动化学院南京 210023;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;文字信息处理;
关键词
成为用户搜索信息必不可少的工具.关键词以凝练简洁的形式对文本主题进行有效概括; 通过提取关键词; 可以结构化地表示目标文本; 提高人们的文献管理与检索效率.;

相似文献

中文文献
外文文献
专利

1. 基于PageRank算法的文本关键词权重计算研究 [J] . 王庆福 . 网络新媒体技术 . 2015,第003期
2. 基于PageRank算法的文本关键词权重计算研究 [J] . 王庆福 . 网络新媒体技术 . 2015,第003期
3. 基于大数据技术的网络热搜关键词提取算法 [J] . 王珊珊 ,梁同乐 . 电子测试 . 2021,第010期
4. 基于SVM的融合多特征TextRank关键词提取算法 [J] . 朱衍丞 ,蔡满春 ,芦天亮 . 软件导刊 . 2020,第002期
5. 基于粗糙数据推理的TextRank关键词提取算法 [J] . 周宁 ,石雯茜 ,朱昭昭 . 中文信息学报 . 2020,第009期
6. 近5年中国新闻传播领域学术研究热点分析——基于25种专业核心期刊发文关键词词频的研究 [C] . 王海峰 . 2018新媒体国际论坛 . 2018
7. 新闻文本关键词提取算法研究与实现 [A] . 田脉 . 2019

基于PageRank的新闻关键词提取算法

摘要

著录项

相似文献

相关主题

期刊订阅