您现在的位置: 首页> 研究主题> TextRank

TextRank

TextRank的相关文献在2010年到2022年内共计149篇,主要集中在自动化技术、计算机技术、信息与知识传播、科学、科学研究 等领域,其中期刊论文121篇、会议论文1篇、专利文献27篇;相关期刊72种,包括情报学报、现代图书情报技术、计算机科学等; 相关会议1种,包括第六届全国信息检索学术会议等;TextRank的相关文献由407位作者贡献,包括夏天、朱晓亮、陶宏才等。

TextRank—发文量

期刊论文>

论文:121 占比:81.21%

会议论文>

论文:1 占比:0.67%

专利文献>

论文:27 占比:18.12%

总计:149篇

TextRank—发文趋势图

TextRank

-研究学者

  • 夏天
  • 朱晓亮
  • 陶宏才
  • 林民
  • 石昀东
  • 顾益军
  • 仲梁维
  • 余章馗
  • 倪静
  • 刘三女牙
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 梁一鸣; 赵永翼
    • 摘要: 社交媒体平台中存在的大量虚假新闻伴随着网络的快速发展,影响范围扩大,造成了不良社会影响以及经济损失。为快速有效地实现虚假新闻的检测,提出一种基于支持向量机的虚假新闻检测研究的方法。通过TextRank提取文本特征向量,使用网格搜索交叉验证方法对支持向量机(Support Vector Machine,SVM)参数寻优,对其新闻数据集进行虚假检测、分类,从而识别虚假新闻。实验结果表明,本文提出的方法与朴素贝叶斯和决策树相比,在虚假新闻检测问题上效果较好。
    • 唐恒; 高清; 孙莹琳; 肖寒姿
    • 摘要: 为了解知识产权政策在中小企业知识产权战略推进工程中的实施情况,基于文本挖掘技术对我国2009—2020年中央层面的中小企业知识产权政策进行分析。首先采用数理统计法和社会网络分析法从宏观角度对政策发文量、发文部门进行梳理分析,其次引入Textrank算法构建政策主题词库,结合UCINET6.0工具进行政策主题和措施分析。研究发现,目前我国中小企业知识产权政策存在针对性需提升、政策合力不够、配套细则有待完善、政策措施配置不均衡等问题,并提出相应建议。
    • 于腊梅; 杨良斌
    • 摘要: 将信息熵融入TextRank算法中分词器部分以改善关键词抽取的准确度。在分词前,先用信息熵的方式提取文章的关键新词,加入到分词字典中,使分词器能够自主识别新词,以增强文章关键词提取的准确性。当语料中存在新词的时候,关键词抽取准确度效果提升明显,对不存在新词的语料关键词抽取准确度无明显提升。改善分词效果可以提升关键词抽取准确度。
    • 李栋凯; 张永昌
    • 摘要: 将textrank、word2vec和MMR3种语言模型用于基于文本相似度的新闻自动摘要提取。实验结果表明textrank算法得到的摘要语句可读性较差,理解困难;在textrank算法基础上增加word2vec模型后对整篇新闻的概括度较高,但却不能很好地解决信息冗余和效率低的问题;MMR可以有效去除信息冗余,体现语义的多样性。
    • 黄菲菲
    • 摘要: 基于图模型的TextRank方法形成的摘要不会脱离文档本身,但在抽取文本特征的时候,传统的词向量获取方法存在一词多义的问题,而基于BERT的词向量获取方式,充分挖掘了文本语义信息,缓解了一词多义问题。对不同词嵌入方法进行了实验对比,验证了BERT模型的有效性。基于词频统计的相似度计算方法也忽略了句子的语义信息,文中选择了向量形式的相似度的计算方法用于文本摘要生成。最后在TTNews数据集上做实验,效果有了明显的提升。
    • 付薇薇; 王东娟; 张顺
    • 摘要: 为构建一种能够准确有效地在医保问题库中检索到与用户提出的问题匹配度最高的问题,提出了一种融合逻辑回归分类模型和TextRank关键词抽取的文本快速检索方法。首先从医保局官网以及百度文库中收集医保问答对,根据医保问答数据特征,采用对比分析方法找到最优的文本检索方案。实验结果表明,逻辑回归分类模型速度更快、准确度更高,配合基于图排序的关键词检索方式TextRank,能够有效地检索到与用户问题匹配度最高的医保问题。
    • 许睿; 唐海; 沈林豪
    • 摘要: 近年来知识图谱广泛应用于在线智能学习系统,在知识图谱的自动构建过程中,关键词抽取是其首要环节。在当前众多关键词抽取方法中TextRank算法应用最为广泛。在线学习系统有大量视频学习资源,而目前的关键词抽取方法主要用来处理论文、新闻报道等文本资源。为从视频学习资源中抽取关键词,在TextRank算法基础上,提出一种改进的关键词抽取方法TW-TextRank。首先通过语音识别把视频资源转换为文本,然后获取关键词在视频中的时长并计算权重,最后进行关键词抽取和排序。实验以8门C语言教学视频作为素材,和传统TextRank算法进行比较,结果表明TW-TextRank算法对召回率和F值有较为明显的提升效果,在视频资源的知识图谱构建方面有较强实用性。
    • 宛艳萍; 张芳; 谷佳真
    • 摘要: 在传统基于关键词属性、情感属性和位置属性提取关键句的文本情感倾向性研究的基础上,提出一种融合全局特征和自身特征双窗口的加权TextRank关键句提取算法(WTTW算法),使用soft_voting对提取的关键句进行情感倾向性分析的方法。从全局特征出发通过关键词特征、位置特征、句子之间的相似度加权求和构建窗口为2的TextRank图模型,即将整个文本作为一个单元,设置长度为2的滑动窗口,从第一句至最后一句顺序进行滑动窗口建立图模型,迭代得到各句子的得分;再根据句子情感特征和标点特征对句子得分进行调整,得到关键句;使用soft_voting对提取的关键句进行情感倾向性分析。在四个不同领域进行实验,实验结果表明,该方法在各种评价指标下均显著优于baseline,具有高效性。
    • 张举; 冯翱; 张学磊; 刘涛; 栗荣成; 周道华; 杨陈; 曾俊
    • 摘要: 对于在线平台和论坛中的旅游评论文本进行情感分析一方面有助于景区理解游客的需求,提高景区服务品质,另一方面为游客提供出游参考信息,以达到更好的旅游满意度,具有较高的应用价值。本文针对旅游评论文本普遍较长的特征,提出了融合Text-Rank的情感分类方法。在进行情感分类之前先使用Text-Rank方法对较长的文本进行自动摘要,使用摘要压缩后的内容作为输入进行情感分类。使用RNN、LSTM、Text-CNN、BERT等深度学习模型进行实验,结果显示融合后的方法在准确率等各项指标上均取得了一定程度的提升。该方法对于原始文本较长、包含多方面内容的输入信息具有较大价值,能够提高文本处理效率,提高分析精度。
    • 杨陈菊; 邵玉斌; 孙俊; 龙华; 皮乾东
    • 摘要: 通过剖析短语结构层次句法分析的层次性和汉语结构特点,提出了一种把核心词作为词块的形式替换、层层进行词块组合的句法结构树.在句法边界分析的过程中,将词块识别和核心词提取分开进行.在词块识别模块,使用双向长短期记忆模型(Bi-directional Long Short-Term Memory,BiLSTM)和条件随机场(Conditional Random Field,CRF)结合的模型(BiLSTM+CRF)进行词块边界标记的识别,其中BiLSTM模型学习上下文特征,CRF模型学习输出标记序列结果的转移特征,达到预测标记序列联合解码的作用;在核心词提取模块,结合Word2vec词向量改进TextRank重要度排序算法,通过加入词语的相似度信息、位置信息、词性信息来提高识别准确度.实验对比了CRF、BiLSTM、BiLSTM+CRF词块识别分别与三种信息组合的TextRank核心词识别的句法边界分析效果,并对比了各句长下每种模型的识别情况.结果表明,使用BiLSTM+CRF联合改进的TextRank识别效果最好,相比于基线LR方法F1值提升了6.58个百分点,整句正确率提升了3.68个百分点,验证了模型的有效性和稳定性.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号