您现在的位置: 首页> 研究主题> 抽取

抽取

抽取的相关文献在1935年到2023年内共计11380篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、临床医学 等领域,其中期刊论文673篇、会议论文14篇、专利文献10693篇;相关期刊443种,包括现代图书情报技术、科技信息、中国煤层气等; 相关会议11种,包括2010国际仪器仪表与测控技术大会、第10次全国精神病学术交流会暨《中国民康医学》创刊20周年庆典、第19届全国儿科药学学术会议等;抽取的相关文献由20760位作者贡献,包括不公告发明人、余正涛、程学旗等。

抽取—发文量

期刊论文>

论文:673 占比:5.91%

会议论文>

论文:14 占比:0.12%

专利文献>

论文:10693 占比:93.96%

总计:11380篇

抽取—发文趋势图

抽取

-研究学者

  • 不公告发明人
  • 余正涛
  • 程学旗
  • 张涛
  • 叶立明
  • 王伟
  • 王磊
  • 祝传宝
  • 周国栋
  • 张成君
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 许睿; 唐海; 沈林豪
    • 摘要: 近年来知识图谱广泛应用于在线智能学习系统,在知识图谱的自动构建过程中,关键词抽取是其首要环节。在当前众多关键词抽取方法中TextRank算法应用最为广泛。在线学习系统有大量视频学习资源,而目前的关键词抽取方法主要用来处理论文、新闻报道等文本资源。为从视频学习资源中抽取关键词,在TextRank算法基础上,提出一种改进的关键词抽取方法TW-TextRank。首先通过语音识别把视频资源转换为文本,然后获取关键词在视频中的时长并计算权重,最后进行关键词抽取和排序。实验以8门C语言教学视频作为素材,和传统TextRank算法进行比较,结果表明TW-TextRank算法对召回率和F值有较为明显的提升效果,在视频资源的知识图谱构建方面有较强实用性。
    • 倪兵; 廖光忠
    • 摘要: 为提升基于TextRank算法的关键词抽取效果,分析中文语义结构和分词算法的特点,提出一种融合语义依存和外部知识库的方法。使用语义依存图代替共现窗口构建词图,增强词图中各节点间的语义联系;在此基础上引入规范化谷歌距离和领域词典这两个外部知识库特征,结合文档内外部信息对词图中的边进行加权计算,对提取出的文档关键词应用前后向匹配算法做进一步处理,使提取的关键词更具语义完整性。实验结果表明,该方法在数据集上的关键词抽取效果有了显著提升,可读性更强,验证了所提方法的有效性。
    • 王昊; 刘丹; 刘硕
    • 摘要: 针对TextRank算法在抽取篇章关键词时忽略句法信息、主题信息等问题,提出基于句法分析与主题分布的篇章关键词抽取模型(S-TAKE)。模型分为段落和篇章两阶段递进抽取篇章关键词,首先以段落为单位,结合词共现、语法及语义信息抽取段落关键词;然后根据段落主题对段落聚类,形成段落主题集;最后根据段落主题分布特征抽取篇章关键词。在公开的新闻数据集上,模型的抽取效果较原始TextRank提升了约10%。实验结果表明,S-TAKE的抽取效果有了明显提升,证明了语法信息及主题信息的重要性。
    • 扈景召; 王文政; 杜丹
    • 摘要: 为了解决大规模相控阵天线和宽带相控阵需要对阵元间或者子阵间高精度相位时延补偿问题;该文对一种基于高阶内插抽取滤波实现高精度相位时延的方法进行了仿真及实现。
    • 祖弦; 谢飞; 刘啸剑
    • 摘要: 各类应用领域的文本数据日益增多,如何从这些海量数据中迅速准确地提取核心内容,已成为关键词抽取的主要任务.提出一种基于词和文档嵌入的关键词抽取方法,通过计算单词与文档在同一维度上的向量表示,得出每个单词与文档之间的语义相似度,将其作为无向图中每个单词节点的初始权重.接着使用带语义偏向的随机游走策略,计算出每个单词以及候选词的分值.最后选取得分较高的前N个候选词作为最终关键词.在公开数据集上的实验结果表明,该算法在准确率、召回率、F值上均超过现有的主流关键词抽取方法,极大提高了关键词自动抽取的效率.
    • 成彬; 施水才; 都云程; 肖诗斌
    • 摘要: [目的]利用CRF模型处理序列标注问题的优势,通过将词性信息和CRF模型融入BiLSTM网络,实现期刊关键词的自动抽取.[方法]将关键词抽取问题视为一个序列标注问题.对期刊文本进行分词和词性标注的预处理;对预处理后的文本使用Word2Vec模型进行Word Embedding向量化,获取字词的向量表达式;使用BiLSTM-CRF模型进行关键词的自动抽取.[结果]使用融合词性的BiLSTM-CRF网络,在采集的知网期刊文本上进行实验,在简单关键词方面,准确率较原始的BiLSTM模型提升3%;在复杂关键词方面,准确率较原始的BiLSTM模型提升12%.[局限]期刊关键词抽取模型无法准确抽取复杂关键词,需要针对复杂关键词层面进一步提升模型性能.[结论]融合词性的BiLSTM-CRF模型与传统方法相比,具有较高的识别准确率,是一种有效的关键词抽取方法.
    • 赵占芳; 刘鹏鹏; 李雪山
    • 摘要: 实现铁路行业海量的铁路科技信息资源有效地组织管理并提供智能化、专业化的检索和服务,已经成为科研人员迫切期望解决的问题.关键词自动抽取技术是实现信息的智能检索和标引分类的核心技术,本文提出了一种改进TextRank的关键词抽取算法应用于铁路文献关键词的抽取,该算法融合多个特征因素改进词汇节点的初始权重设置,并利用Word2Vec训练的词向量表征改进词节点间的转移概率.实验结果表明:本文所提出的关键词抽取算法相对于经典的TextRank和TF-IDF算法在准确率,召回率以及F值上都有较大的提升.与TextRank相比,F值提升了13.9%.
    • 成彬; 施水才; 都云程; 肖诗斌
    • 摘要: 【目的】利用CRF模型处理序列标注问题的优势,通过将词性信息和CRF模型融入BiLSTM网络,实现期刊关键词的自动抽取。【方法】将关键词抽取问题视为一个序列标注问题。对期刊文本进行分词和词性标注的预处理;对预处理后的文本使用Word2Vec模型进行Word Embedding向量化,获取字词的向量表达式;使用BiLSTM-CRF模型进行关键词的自动抽取。【结果】使用融合词性的BiLSTM-CRF网络,在采集的知网期刊文本上进行实验,在简单关键词方面,准确率较原始的BiLSTM模型提升3%;在复杂关键词方面,准确率较原始的BiLSTM模型提升12%。【局限】期刊关键词抽取模型无法准确抽取复杂关键词,需要针对复杂关键词层面进一步提升模型性能。【结论】融合词性的BiLSTM-CRF模型与传统方法相比,具有较高的识别准确率,是一种有效的关键词抽取方法。
    • 赵文超; 黄伟; 李翔; 侯改利
    • 摘要: 低通抽取结构的软件无线电接收机模型在高取样率输入时,数字滤波器需要提供很高的运算速度,对实时处理极为不利.为了降低硬件数据运算要求,有效提高接收机的实时处理能力,同时提升硬件运行稳定性,提出了一种基于多相滤波的软件无线电接收机结构,为高取样率实时处理系统提供了可实现方案.算法分析和仿真结果表明,该结构具备实时性强、稳定性好及运算精度高的特点.
    • 房冬丽; 陈正雄; 黄元稳; 衡宇峰
    • 摘要: 近年来,知识图谱领域中实体关系抽取技术得到快速发展,其准确性也大幅提升.然而,大部分文献都没有提供能够反映其内容的、直观的数据结构.依靠人工阅读文本产生实体、关系的方法,在多源、海量文档数据的今天越来越不能满足实际应用的需求,因此提出一种抽取文本中实体关系的方法.该方法基于哈工大语言技术平台(Language Technology Plantform,LTP)和双向编码器(Bidirectional Encoder Representations from Transformer,BERT)模型,可对文本内容实现自动化解析,解决了数据集生成难的问题.此外,通过对BERT模型的优化调整,解决了以往实体关系的抽取需依赖大量资源计算的问题.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号