主题信息
主题信息的相关文献在1992年到2022年内共计128篇,主要集中在自动化技术、计算机技术、信息与知识传播、常用外国语
等领域,其中期刊论文80篇、会议论文10篇、专利文献313541篇;相关期刊71种,包括天风、中国工运、西南民族大学学报(人文社科版)等;
相关会议10种,包括2012年山东省科协学术年会、2011城市发展与规划大会、第十一届全国计算语言学学术会议等;主题信息的相关文献由260位作者贡献,包括余正涛、相艳、本刊编辑部等。
主题信息—发文量
专利文献>
论文:313541篇
占比:99.97%
总计:313631篇
主题信息
-研究学者
- 余正涛
- 相艳
- 本刊编辑部
- 线岩团
- 黄于欣
- 黄天航
- 于志强
- 何莉
- 刘均
- 吴科炜
- 吴蓓
- 周永祥
- 周泽成
- 唐宁
- 唐昌宏
- 寇菲菲
- 廖祥文
- 张旭
- 张铎
- 徐超
- 李鸿轩
- 杜军平
- 林鸿飞
- 殷润达
- 沈艳艳
- 王磊
- 罗曼·A·德登诺克
- 董雄飞
- 蔡庆生
- 许明英
- 赵伟
- 郑庆华
- 郝流畅
- 郭军军
- 郭朝彤
- 陈国龙
- 魏笔凡
- 黄林鹏
- A·莫辛德拉
- A·萨拉马托夫
- Dong Jing-ling
- D·M·桑德斯
- FeiGuangzheng
- G·罗耶
- He Ting-ting
- H·莱萨马瓜达拉马
- Jin Yiming
- Joe
- J·G·巴尔莫利拉布拉
- J·华
-
-
郭雨欣;
陈秀宏
-
-
摘要:
自动文本摘要能够帮助人们快速筛选、辨别信息,掌握新闻关键内容,缓解信息过载问题。主流的生成式自动文摘模型主要基于编码器-解码器架构。针对解码器端在预测目标词时未充分考虑文本主题信息,并且传统的Word2Vec静态词向量无法解决一词多义问题的现状,提出了一种融合BERT词嵌入表示和主题信息增强的中文短新闻自动摘要模型。编码器端联合无监督算法获取文本主题信息并将其融入注意力机制中,提升了模型的解码效果;解码器端将BERT预训练语言模型抽取出的BERT句向量作为补充特征,以获取更多的语义信息,同时引入指针机制来解决词表外的单词问题,并利用覆盖机制有效抑制重复。在训练过程中,为了避免暴露偏差问题,针对不可微指标ROUGE采用强化学习方法来优化模型。在两个中文短新闻摘要数据集上的多组对比实验结果表明,该模型在ROUGE评价指标上有显著的提升,能有效融合文本主题信息,生成语句流畅、简明扼要的摘要。
-
-
周永祥
-
-
摘要:
说明性文章“四要素”式的阅读教学方式屡被批评,却难以改变。就初中学段而言,这样局面的产生,其根源还要归结到课程标准对说明性文章阅读教学目标陈述的偏颇。说明性文章阅读教学应当以建构读者的主题信息网络为目标,并围绕此探寻教学路径,依从读者对信息的提炼组织、评估筛选、拓展重构、交流完善的阅读认知和体验过程设计教学,开展活动。
-
-
周永祥
-
-
摘要:
说明性文章"四要素"式的阅读教学方式屡被批评,却难以改变.就初中学段而言,这样局面的产生,其根源还要归结到课程标准对说明性文章阅读教学目标陈述的偏颇.说明性文章阅读教学应当以建构读者的主题信息网络为目标,并围绕此探寻教学路径,依从读者对信息的提炼组织、评估筛选、拓展重构、交流完善的阅读认知和体验过程设计教学,开展活动.
-
-
边钊;
唐娉;
闫珺
-
-
摘要:
[目的]分析规范化数据对于主题信息挖掘的影响,并提出遥感领域文献关键词标引规则的制定建议.[方法]以遥感领域1996年、2006年以及2016年中国知网收录的文献为3个数据子集,抽取文献的关键词,并按照关键词出现频次进行从高到低排序,提取排名靠前的(如前10%)的高频词作为研究对象.通过关键词的共现频次、期刊影响因子、文献被引频次等构建相似矩阵,利用谱聚类方法进行遥感领域研究主题的挖掘.[结果]对关键词进行尺度规范化以及名称规范化处理,使聚类结果由初步分析到优化分析,这也是初级结果进一步细化的过程,但是最终的聚类结果中很多信息并没有体现出来,因此对关键词按照一定的规则进行重塑后再次进行聚类,聚类结果中凸显出遥感数据源的信息、传感器的信息、技术方法的信息等,使研究主题进一步清晰.[结论]关键词规范化对提高文献主题信息挖掘是可行的,因此按照遥感领域的学科特点对关键词按照一定的规则进行规范化处理是非常必要.延伸到科技期刊出版领域,规范化的数据可为期刊的高效精准知识服务提供数据支撑.
-
-
迟海洋;
严馨;
徐广义;
陈玮;
周枫
-
-
摘要:
问答系统的一项关键任务就是如何理解用户的问句意图并将其正确地分类到相应的领域中,其分类性能直接影响着问答系统的质量.针对中文医疗健康问句数据量庞大但文本字符数少、特征稀疏的特点,以及传统卷积神经网络和循环神经网络的不足,提出了一种融合主题信息和Transformer模型的健康问句意图分类方法.首先,对短文本数据集预处理后通过BERT预训练语言模型生成词的词向量;其次,分别使用BTM主题模型和TWE模型获得文档-主题矩阵、主题-词矩阵和主题向量矩阵,由矩阵变换生成每个词的主题向量;然后,将词向量和词的主题向量拼接融合后输入到Transformer编码器中进行充分的特征提取并得到句子特征向量;最后,由全连接和Softmax分类器获得输入文本在各个类别的概率,从而实现最终的分类目的 .在中文医疗健康问句数据集上进行不同模型的对比实验,准确率、召回率和F1值指标上均有不错的提升.实验结果表明,本文提出的方法可以有效提高模型的语义表示能力和分类效果.
-
-
蒋杰
-
-
摘要:
随着人工智能的迅速发展,传统的文本摘要技术也从抽取式摘要向生成式摘要发展.当源文档中存在着多个主题的内容时,现有的大多数生成式文本摘要方法会尽全面地对多主题内容进行概括和总结,而对其中包含某个主题的内容可能无法进行细致描述.针对这一问题,本文提出了一个面向主题信息的无监督文本摘要生成方法.在给定目标主题信息的情况下,在解码器中利用注意力机制将目标主题信息与文本本身的主题信息进行信息融合,从而使得包含了目标主题的文本得到较大的注意力权重,以此生成与目标主题相关的文本摘要.在大规模英文文本数据集Yelp上的实验结果验证了所提方法的有效性和先进性.
-
-
本刊编辑部
-
-
摘要:
关键词指论文中最能反映主题信息的特征词汇或词组、短语。我国国家标准规定,对论文的标引使用“关键词”一词,关键词中包括主题词和(或)副主题词以及少数自由词。生物医学领域使用频繁、而且又被使用者认可的主题词,约有15000个;每年最新版美国国立图书馆编辑的《Index Medicus》中医学主题词表(MeSH)内所列的词均有所增删。
-
-
-
-
-
黄天航
- 《2010中国城市规划年会》
| 2010年
-
摘要:
规划的科学性需要定量研究,数据采集就显得越来越重要.本文主要探讨如何针对大北京区域规划过程中的规划、建设用地等方面的主题信息,构建面向数字城市规划的数据仓库的实例,将来自不同专业领域的相关数据以特定的方式整合在一起,利用联机分析处理实现对数据仓库中存储数据做多维分析操作,然后借助特定的专业模型从中发现知识,辅助支持大北京区域规划的决策.
-
-
-
-
王琦;
唐世渭;
北京大学计算机科学与技术系;
杨冬青;
王腾蛟
- 《第二十一届中国数据库学术会议》
| 2004年
-
摘要:
本文基于DOM规范,针对HTML的半结构化特征和缺乏语义描述的不足,提出含有语义信息的STU-DOM树模型,将HTML文档转换为STU-DOM树,并对其进行基于结构的过滤和基于语义的剪枝,能够准确地提取出主题信息,方法不依赖于信息源,而且不改变源网页的结构和内容,是一种自动、可靠和通用的方法,具有可观的应用价值,可应用于PAD和手机上的Web浏览以及信息检索系统。
-
-
-
-
何莉;
林鸿飞
- 《2009年全国开放式分布与并行计算学术年会》
| 2009年
-
摘要:
在分布式检索中,基于主题的语言模型集合选择方法首先引入Relevance Model计算用户查询和信息集合中文档的相似度,在此基础上通过文本聚类得到集合中文档的主题信息,加入语言模型计算得到各个信息集合的查询相关度排名,以此完成集合选择.实验表明,与ODRI、CRCS和基于传统语言模型的集合选择算法相比,该方法的检索效果得到了显著提高.
-
-
-
- 《第四届全国信息检索与内容安全学术会议》
| 2008年
-
摘要:
主题爬虫根据用户查询确定主题信息,通过网页间的超链接,有选择性的在Web上遍历,获取与主题相关网页.它遍历的是整个Web中特定的部分区域.因此为了在较短时间内获取更多的主题信息,起始地址的选择显得异常重要.超链接,作为整个Web网络的连接者,隐含着大量的主题信息.本文使用一个关于网页链接的文本集来模拟Web结构,通过实验结果分析主题区域在Web上的分布规律,验证根据查询主题选择初始URL对主题爬行虫有重大意义.最后结合图论中的相关知识,针对目前初始URL选择所存在的问题给出相应的解决方案.
-
-
单铁城;
张安妮;
马德辉
- 《2012年山东省科协学术年会》
| 2012年
-
摘要:
对于普通搜索引擎技术特点和实现过程,通过系统地分析比较研究,采用基于主题改进爬虫算法,设计实现一个能更好地满足用户不同搜索需求的主题搜索引擎,该搜索引擎具有科学性、高效性、实用性、易操作性等优点.使用本搜索引擎,对多个大型网站进行查询搜索,通过实验数据对比,结果表明,该引擎的数据查全率和查准率都高于普通搜索引擎,具有较高的推广利用价值.