主题演化
主题演化的相关文献在2008年到2022年内共计203篇,主要集中在信息与知识传播、科学、科学研究、自动化技术、计算机技术
等领域,其中期刊论文177篇、会议论文12篇、专利文献5339篇;相关期刊88种,包括信息资源管理学报、情报理论与实践、情报探索等;
相关会议12种,包括信息系统协会中国分会第六届学术年会、中国医学科学院/北京协和医学院医学信息研究所/图书馆2014年学术年会、中华医学会第第二十次全国医学信息学术会议等;主题演化的相关文献由462位作者贡献,包括杨秀璋、于琦、刘自强等。
主题演化
-研究学者
- 杨秀璋
- 于琦
- 刘自强
- 夏换
- 安新颖
- 宗乾进
- 武帅
- 袁勤俭
- 刘君杰
- 刘艳华
- 张发亮
- 王效岳
- 白如江
- 罗子江
- 贺培凤
- 邰杨芳
- 化柏林
- 吴乐艳
- 孙巍
- 岳丽欣
- 张学福
- 李保利
- 李勇
- 杨云帆
- 杨星
- 杨金庆
- 沈思
- 王思源
- 王莉亚
- 袁永旭
- 赵凯
- 万小军
- 于小民
- 任天舒
- 任照博
- 伊惠芳
- 何伟林
- 何鸣
- 冯涛
- 刘建义
- 刘玉琴
- 刘细文
- 刘迪
- 叶媛
- 叶文豪
- 吕鑫
- 吴於茜
- 吴澄
- 周厚奎
- 周沫
-
-
令狐秋萍;
何世群;
齐梦珂;
罗子江;
杨秀璋
-
-
摘要:
水族文化的主题挖掘和主题演化分析有助于从不同角度了解水族发展状况、热点主题和研究趋势,为后续水族文化传承和文献挖掘提供相关参考价值。基于此,本文采集中国知网990篇水族文献,提取水族文化关键词及主题,利用共现分析和层次聚类挖掘水族关键词间的联系,构建水族主题共现知识图谱和主题演化网络。实验结果表明,本文的方法能有效分析水族文献的主题演化趋势,发现特征词共现关系和相似度,构建水族文化主题知识图谱,并聚类形成五大类水族文献主题,对少数民族文化研究和文献挖掘具有一定的应用价值和理论意义。
-
-
杨洋
-
-
摘要:
通过信息计量、聚类分析、主题演化等方法,以Web of Science核心数据集为来源,对2000年~2019年多媒体信息处理中人工智能方法应用进行检索,共得到5162条检索结果,对多媒体信息处理中人工智能方法应用的研究热点及主题演化进行深入分析。
-
-
齐梦珂;
罗子江;
赵凯;
杨云帆;
杨秀璋
-
-
摘要:
大数据时代下我国关于档案服务创新的研究成果大量问世。本文基于数据挖掘技术进行我国档案服务创新相关文献的主题发现及演化研究。首先利用LDA模型抽取期刊数据主题及关键词,再采用Word2vec获取词向量并通过加权得到主题向量,进而计算主题相似度与重要度,最后以可视化方法构建主题共现图谱和主题演化图谱。研究结果表明:(1)近二十年部分产业依托信息化创新完善档案服务工作,政府部门依托人文与制度创新进行优化和改革。(2)我国关于档案服务创新的研究层次越来越丰富,学术科研开始得到重视,近二十年主要存在两条关键主题演化路径,分别是高校企业医院的档案服务信息化创新与国家档案部门的建设管理和文化创新。
-
-
李华东;
张晶晶;
刘细文
-
-
摘要:
为深刻认识重大科技基础设施的战略价值,充分发挥其科研潜力,支撑国家未来对重大科技基础设施的统筹布局,以欧洲大型强子对撞机(LHC)、北京正负电子对撞机(BEPC)以及日本非对称正负电子对撞机(KEKB)为研究对象,构建重大设施成果对学科领域发展影响机制模型和适用于高能物理领域的主题词库,使用基于模式匹配的主题抽取法分析相关设施成果的引文分布及主题强度演化,并提出设施成果“价值持续性”“价值重要性”概念,定义重大设施对学科领域发展的4种影响类型以及形成类型判别的三维战略坐标。结果发现:LHC运行时间最短但成果总量大幅领先,且具有积极影响类型的成果集中出现在LHC中;Belle在高被引论文占比与数量方面都明显较高;BEPC在成果产出方面与其他设施有较大差距。最后,为推动中国重大科技基础设施对学科领域发展产生更多更重要的积极影响,提出要提高现有设施运行与科研效率、发掘具有优势前景的研究领域等对策建议。
-
-
陈启明;
王效岳;
白如江;
杜清玲
-
-
摘要:
[目的/意义]旨在为政府实施健康舆论引导和擎画预警防控方案提供参考。[方法/过程]以“新冠肺炎疫情”为例,通过融合突发公共事件相关新闻数据和政策文件,综合运用自然语言处理和文本主题识别等方法,提出基于主题强度、主题相似度、政策敏感度(PSPE)的主题演化分析思路,描绘突发公共事件主题社会关注和政策趋向的发展状态。[结果/结论]社会关注从国内国际疫情的通报逐步演化为突发性地区事件和疫情对生活影响等主题;反馈型敏感度新闻主题会引导政策发布的趋向,引导型敏感度政策主题会指导新闻发布的趋向。
-
-
孟璇;
熊回香;
叶佳鑫
-
-
摘要:
文章从共词网络视角出发,将主题演化分析研究思路引入研究方法的演化分析,以反映主题维度下研究方法的演化情况,并提出学术论文研究方法演化分析模型。首先,通过关键词语义类型划分和基于共词强度的选词策略构建共词网络;其次,利用Louvain算法对共词网络进行主题识别,并根据相邻时期主题关联的强度来构建主题演化链;最后,依据主题演化链从主题社区中提取研究方法类关键词以初步构建研究方法演化链,在此基础上通过研究方法的扩充及其重要性评价对研究方法演化链进行优化,并对该演化链进行分析和阐释。实证结果表明该模型可以较好地从主题维度描述其对应研究方法的演化情况。
-
-
宋士杰;
赵宇翔;
朱庆华
-
-
摘要:
信息技术的蓬勃发展带来了全球信息的爆炸式增长,同时也使人们在面对海量信息时必须充分考虑可信度问题。国际iSchools运动衍生出的iField学科以图书馆学、情报学为代表,也与传播学、计算机科学等其他信息相关学科有一定交叉。iField视域下的可信度研究涉及人、信息、技术与社会的交互,本文梳理过去二十余年间国内外在这一领域的研究和探索。首先,从概念内涵、理论基础、研究方法三个层面对可信度研究进行溯源;其次,基于技术环境与社会环境变迁的双重视角解析可信度研究的主题演化逻辑,总结可信度研究在Web 1.0、Web2.0、社交媒体、人工智能四个标志性阶段的研究重点与难点,并提炼出可信度研究的主题演化框架;最后,从概念内涵拓展、研究方法革新、可信度话题延展等角度对未来研究进行了前沿展望。本文希望厘清可信度研究的发展脉络,推动可信度研究的进一步拓新,为未来网络信息资源治理实践提供参考。
-
-
王雨童;
刘玉琴
-
-
摘要:
为厘清20年来中国数字出版技术研究脉络,发现数字出版技术的研究热点、前沿趋势,为出版企业转型升级指明方向,为数字出版学术研究提供参考,本文运用文本挖掘和信息可视化方法对2001-2020年数字出版技术相关文献进行分析。研究发现,数字出版技术研究主题愈加丰富、多元;2001-2008年偏向于以数据赋能出版的数字化,2009-2015年偏向于以通信技术赋能出版的智能化,2016-2020年偏向于以技术融入出版全流程的融合化;机构、期刊、学科间研究实力均呈现出明显的不均衡性。
-
-
陈稳;
陈伟
-
-
摘要:
[研究目的]基于研究前沿多维特征指标测度识别研究前沿,分析科学前沿主题与技术前沿主题间的联系及其演化。[研究方法]首先,对论文和专利数据进行主题挖掘,从前沿主题特征出发通过新颖度、增长性、影响力和交叉性4个测度指标识别出研究前沿,分析科学前沿主题与技术前沿主题间的联系;其次,通过主题相似度计算、主题过滤等方法识别具有演化关系的主题对,并对前沿主题内容演化过程进行可视化分析。[研究结论]以固体氧化物燃料电池领域为例,识别出了包括固体氧化物燃料电池堆研究等在内的4个科学前沿主题与复合电极材料在内的4个技术前沿主题,科学研究与技术研究互相推进,呈现双螺旋式发展。
-
-
马建红;
王晨曦;
闫林;
姚爽
-
-
摘要:
专利技术主题演化蕴含着产品技术的发展脉络,如何对其进行准确把握对产品的技术研究人员至关重要。针对现有的专利技术主题演化分析研究中的不足,提出了一种基于产品生命周期的专利技术主题演化分析方法:针对现有时间特征划分方式会导致产品发展前期主题信息被淹没的问题,提出一种产品生命周期划分方法,利用专利增长规律和局部主题语义相似度划分产品生命周期。然后,针对现有主题挖掘方法对专利文献的适用性差、主题技术特点不明显等问题,提出MW-LDA(multiple weighted latent Dirichlet allocation)的专利技术主题提取方法,多角度改进词汇权重并构造复合权值,优化LDA模型生成特征词的过程,使其更适用于专利文本。接着,提出产品专利技术主题演化分析方法,利用阶段间的主题关联强度,实现产品生命周期不同阶段的技术主题演化分析。最后,在由电动车辆动力装置的专利构成的语料库上的实验结果以及对比实验表明,本文方法能够有效地发现专利的技术主题,并分析产品的发展态势,可为科学研究和科技政策制定提供支持。
-
-
Liqin Zhou;
周利琴;
潘建鹏;
张斌
- 《信息系统协会中国分会第七届学术年会》
| 2017年
-
摘要:
目的/意义:从宏观、中观和微观层面探测慢病医学文献的社群和主题演化趋势,对发现慢病领域的研究热点和前沿,理解慢病领域概况和促进慢病领域专家之间的知识交流具有重要意义. 方法/过程:本文以高血压为例,将PubMed数据库中下载的26717篇与高血压相关的文献题录数据作为研究对象,抽取高频主题词对其构造共现矩阵,采用社会网络分析SNA(Social network analysis)从中观层面探测高血压医学文献的社群划分和主题分布情况;同时采用扩展的主题模型DMR(Dirichlet-multinomial regression)从微观层面研究高血压医学文献的主题分布和演化趋势;最后,分析上面两种方法关联和异同点. 结果/结论:研究发现,高血压医学文献主要集中在3个社群,可分为危险因素、研究方法、患者基本情况、诊断治疗和动物实验这5个研究主题,主题的相对分布比率随着时间变化而不断改变.SNA和DMR方法获取的主题基本相似,但是主题词略有差异;从宏观上看,SNA识别主题的效果更好.
-
-
Liang Meihong;
梁美宏
- 《2015年中国科技信息资源管理与服务年会》
| 2015年
-
摘要:
研究我国图书情报档案学(简称“图情档”)课题指南主题的总体演化特征,探讨课题指南对图书情报档案学学科发展的指导作用及指南设立的合理性,并对指南设立提出建议.运用信息熵方法对国家社科基金图书情报档案学学科历年课题指南主题进行定量处理,从时间、主题两方面出发进行主题演化分析,并结合学科发展实际得出结论.我国社科基金图情档学科课题指南熵值整体呈上升趋势,学科研究范围越来越广,指南涉及主题分布越来越均衡,一些主题设立存在不连续等情况.我国社科基金图情档学科课题指南对学科发展有积极导向作用,但在整体及某些具体主题的把握上仍有待进一步加强.
-
-
-
Li Yong;
李勇
- 《中国医学科学院/北京协和医学院医学信息研究所/图书馆2014年学术年会》
| 2015年
-
摘要:
采用按时间先离散的方法建立主题模型,通过监测主题在不同时间片内的变化趋势进行主题演化分析.在各时间片中分别建立LDA模型;利用前一时间片的后验概率影响当前时间片的先验概率来维持主题间的连续性;使用Gibbs算法进行推理,获取主题-词和文档-主题的概率分布;利用KL距离来计算主题之间的相似度,刻画其演化情况.并以此方法对近十年中国医学类SCI论文进行了主题演化分析.
-
-
赵迎光
- 《中华医学会第第二十次全国医学信息学术会议》
| 2014年
-
摘要:
在科学技术日益发展的今天,新的知识以几何级数增加,而且数字资源所占的比重越来越大,如何从中快速准确的获取知识发展脉络以及知识演化结构是目前科研人员和情报分析人员共同面临的问题,本文针对该问题,从聚类角度对当前主题演化方法进行调研和梳理,了解目前基于聚类分析的主题演化方法研究进展,指出虽然目前对聚类方法已经相当成熟,但是对于聚集类簇的动态演化研究才刚刚兴起,主要关注的是数据集中潜在结构的动态变化及其背后的内在动因,按照这类方法的适用条件,一般将主题演化分为离线数据集聚类和在线数据集聚类,在线数据集聚类主要是对高可变的数据流进行实时聚类分析。其中典型的方法有Chakrabarti在2006提出的演化聚类,以及已经存在的数据流聚类、增量聚类和约束聚类。
-
-
-
-
YANG Xing;
杨星;
LI Bao-li;
李保利
- 《2012中国计算机大会》
| 2012年
-
摘要:
针对目前科学技术文献数量激增、难以从总体上分析把握的现状,本文提出一种从科技文献中获得研究主题特征词并展现其演化趋势的方法.该方法先利用LDA(Latent Dirichlet Allocation)模型对不同时间片内的话题进行自动抽取,得到不同数量的话题.然后,通过话题过滤剔除意义有限的话题,并借助简单启发式规则选择种子话题.最后,再利用语义相关度将相邻时间片内内容相近的种子话题联系起来,以得到研究主题的演化趋势.实验结果表明,在不对话题生成进行人工干预的前提下,本文方法较真实地描述了研究主题强度和内容随时间的演化趋势,避免了无意义话题对研究主题演化的负面影响.
-
-
李勇;
安新颖
- 《中国医学科学院/北京协和医学院医学信息研究所/图书馆2011年学术年会》
| 2012年
-
摘要:
本文采用按时间先离散的方法建立主题模型,通过追踪不同时间片内主题的变化趋势进行主题演化分析.在各时间片中分别建立Latent Dirichlet Allocation(LDA)模型;利用前一时间片的后验概率影响当前时间片的先验概率来维持主题间的连续性;根据Gibbs算法进行推理,获取主题-词和文档-主题的概率分布,利用Kullback Leibler(KL)相对熵来衡量主题之间的相似度,从而发现主题演化中的"主题遗传"和"主题变异".并在传染病学领域进行了实证。
-